当前位置: 首页 > news >正文

做网站前端难吗网推怎么做

做网站前端难吗,网推怎么做,wordpress items_wrap,酒类网站建设方案案文章目录 1、问题描述2、问题原因3、问题解决 1、问题描述 今天在使用PDFPlumber模块提取PDF文本时extract_text()方法报错,报错内容如下: Traceback (most recent call last):......File "F:\Python\...\site-packages\pdfminer\pdffont.py"…

文章目录

      • 1、问题描述
      • 2、问题原因
      • 3、问题解决



1、问题描述


今天在使用PDFPlumber模块提取PDF文本时extract_text()方法报错,报错内容如下:

Traceback (most recent call last):......File "F:\Python\...\site-packages\pdfminer\pdffont.py", line 1091, in __init__self.unicode_map = ttf.create_unicode_map()File "F:\Python\...\site-packages\pdfminer\pdffont.py", line 826, in create_unicode_mapassert False, str(("Unhandled", fmttype))
AssertionError: ('Unhandled', 6)

报错代码如下:

import pdfplumberwith pdfplumber.open(rf'F:\...\file.pdf') as pdf:for page in pdf.pages:print(page.extract_text())

2、问题原因


经查找原因,最终确定可能是PDF文件本身的原因,具体可见这篇文章:https://github.com/jsvine/pdfplumber/discussions/994?sort=new

ChatGPT则认这种错误是因为库内部遇到了某种它无法处理的情况,ChatGPT给出的解决方案如下:

1) 更新PDFPlumber

pip install --upgrade pdfplumber

2) 检查PDF文件

确认PDF文件没有损坏,并且是文本格式的PDF而不是扫描的图像

3) 使用其他方法

可以尝试使用extract_words()extract_tables()等其他方法,这取决于你需要提取的内容类型

4) 捕获异常

添加异常处理,这样即使遇到错误也不会导致程序崩溃

try:text = page.extract_text()
except AssertionError as e:print(e)text = None

5) 尝试其他库

可以考虑使用其他PDF处理库,如PyPDF2或PyMuPDF等

在尝试了ChatGPT的一些建议后,确定可能是PDF本身的原因,因此考虑使用其他库

3、问题解决


经过尝试,最终发现PyMuPDF库可以解析使用:

import fitzwith fitz.open(rf'F:\...\file.pdf') as doc:for page in doc.pages():print(page.get_text())

看来是PDF本身的原因,我们的PDF可能已经损坏



http://www.tj-hxxt.cn/news/58925.html

相关文章:

  • 做网站卖什么条件seo线上培训机构
  • python node 网站开发近日网站收录查询
  • 网页设计比较优秀的网站线上推广策划方案
  • 家居网网页设计代码温州seo网站推广
  • 网站着陆页有多少个交换友情链接平台
  • 做网站自己买服务器吗产品推广建议
  • 做网站都需要什么b2b电子商务平台
  • 真做视频网站张家界网站seo
  • 贵州网站制作设计公司哪家好天津seo
  • 如何撰写网站建设方案百度竞价托管外包
  • 怎样做二维码链接到网站上站内seo优化
  • 镇江网站营销推广深圳网络推广网络
  • 金融网站模板素材五种新型营销方式
  • 重庆房产网seo推广需要多少钱
  • 做网站公司广州怎样建立自己的网站平台
  • 中国移动官方网站官网今日的头条新闻
  • 做网站考虑的方面直接下载app
  • 网站建设时间、人力及成本估算百度app官方下载
  • 网站建设山东聚搜网络b汕头网站建设方案维护
  • 做片视频在线观看网站广告联盟官网入口
  • 找外包做网站要多久nba最新交易消息
  • 政府网站建设工作室好用的磁力搜索引擎
  • 黄石网站开发目前较好的crm系统
  • 引用网站的内容如何做注释百度快照查询
  • 网站建设方案评标原则seo薪资水平
  • 称为关键词是网站seo的核心工作
  • 有个网站专做品牌 而且价格便宜seo优化官网
  • 贵州网站建设联系电话搜索引擎的工作原理有哪些
  • 做服装店网站的素材上海网络推广培训学校
  • 东阳网站优化百度一下免费下载安装