当前位置: 首页 > news >正文

深圳营销型网站建设推广服务凉州区住房和城乡建设局网站

深圳营销型网站建设推广服务,凉州区住房和城乡建设局网站,国外做名片网站,免费一级域名网站Python 实现读取pdf文件简单示例。 安装命令 需要安装操作pdf的三方类库#xff0c;命令如下#xff1a; pip install pdfminer3K 安装过程如下#xff1a; 引入类库 需要引入很多的类库。 示例如下#xff1a; import sys import importlib importlib.reload(sys)fr… Python 实现读取pdf文件简单示例。 安装命令 需要安装操作pdf的三方类库命令如下 pip install pdfminer3K 安装过程如下 引入类库 需要引入很多的类库。 示例如下 import sys import importlib importlib.reload(sys)from pdfminer.pdfparser import PDFParser, PDFDocument from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter from pdfminer.converter import PDFPageAggregator from pdfminer.layout import LTTextBoxHorizontal, LAParams from pdfminer.pdfinterp import PDFTextExtractionNotAllowed 读取pdf实现 实现步骤为先通过二进制方式打开测试pdf文档创建pdf文档解析测试文档内容 最后读取文件内容保存到另一个文件中。 示例如下 import sys import importlibimportlib.reload(sys)from pdfminer.pdfparser import PDFParser, PDFDocument from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter from pdfminer.converter import PDFPageAggregator from pdfminer.layout import LTTextBoxHorizontal, LAParams from pdfminer.pdfinterp import PDFTextExtractionNotAllowed import osdef read_pdf(path, toPath):# 以二进制方式打开pdf文件f open(path, rb)# 创建一个pdf文档分析器parser PDFParser(f)# 创建pdf文档pdfFile PDFDocument()# 链接分析器与文档对象parser.set_document(pdfFile)pdfFile.set_parser(parser)# 提供初始化密码pdfFile.initialize()# 检测文档是否提供txt转换if not pdfFile.is_extractable:raise PDFTextExtractionNotAllowedelse:# 解析数据# 数据管理器manager PDFResourceManager()# 创建一个PDF设备对象laparams LAParams()device PDFPageAggregator(manager, laparamslaparams)# 解释器对象interpreter PDFPageInterpreter(manager, device)for page in pdfFile.get_pages():interpreter.process_page(page)layout device.get_result()for x in layout:if isinstance(x, LTTextBoxHorizontal):with open(toPath, a, encodingutf-8) as f:print(x.get_text())f.write(x.get_text() \n)path os.path.join(os.getcwd(), test_1.pdf) toPath os.path.join(os.getcwd(), test_2.txt) read_pdf(path, toPath) 注意无法读取中文貌似需要加载中文字体。还有就是在写入pdf文件格式不对无法打开暂时没找到原因。 总结 本篇只是使用Python 实现读取pdf文件简单示例因为时间关系没有做深入的扩展等之后有时间再做补充。
http://www.tj-hxxt.cn/news/129998.html

相关文章:

  • 做直播网站找哪家网站深圳企业网站建设推广外包服务商
  • 网站换空间有影响吗网站建设信用卡取消
  • 微信如何绑定网站服务网络推广
  • h5网站制作案例分析常见的cms系统
  • 用php做的大型网站广州最新进展
  • 网站建设吉金手指排名13成都 企业网站设计
  • 健身网站开发方式的服务器选择网站返回404
  • 大学生做外包项目的网站新安人才网
  • 郑州的做网站公司建设上线网站
  • 请人做网站 我需要知道哪几点做计算机题目的网站
  • flash 网站源码全国特种作业证查询官网
  • 郑州做网站推广电话网站开发代理合同
  • 深圳网站建设 联雅网络成品短视频app源码搭建
  • 手机怎么自己创造网站郑州网站开发比较好的网络公司
  • 荆门网站建设公司wordpress主题开发
  • 怎么查看网站是否做静态化处理网站开发实验报告模版
  • 上海公司核名工商官网seo专业技术培训
  • 网站建设的基本内容wordpress许愿墙
  • 网站怎么快速做排名滨湖区知名做网站选哪家
  • 个人怎么申请专利山东济南网站制作优化
  • 网站哪些页面会做静态化网站定制费用
  • 建立主题网站的顺序一般是wordpress加背景音乐
  • 百度合伙人官方网站红酒手机网站模板
  • 大连哪里有手机自适应网站建设wordpress表格
  • 网站开发需要什么专业市辖区郑州网站建设
  • 网站内容建设 发布形式建筑工程网上报建网站诚信手册
  • 淮北建投网站全球搜索网站排名
  • 网站遭攻击广州网站快速优化排名
  • 网站模板大全 优帮云诚聘高新网站开发工程师
  • 仿网站视频教程衡水注册公司流程和费用