凡科网站建设公司,成品直播源码,wordpress小工具插件下载,满分企业网PDF是面向展示和打印使用的#xff0c;并未考虑编辑使用#xff0c;所以缺少了很多编辑属性且非常难修改PDF里面的数据。当您需要分析或修改PDF文档数据时#xff0c;可以将PDF保存为Excel工作簿#xff0c;实现轻松编辑数据的需求。PDF转Excel#xff0c;技术关键就是提取…PDF是面向展示和打印使用的并未考虑编辑使用所以缺少了很多编辑属性且非常难修改PDF里面的数据。当您需要分析或修改PDF文档数据时可以将PDF保存为Excel工作簿实现轻松编辑数据的需求。PDF转Excel技术关键就是提取原文档内的表格数据保证转换前后数据的一致性方便复制粘贴且可轻松编辑。本文将介绍如何使用 Spire.PDF for Python 在 Python 中实现 PDF 转 Excel。 安装Spire.PDF for Python 本教程需要用到 Spire.PDF for Python。可通过以下 pip 命令将它们轻松安装到 VS Code 中。
pip install Spire.PDF 1. 转换PDF 到Excel Spire.PDF for Python 提供的 PdfDocument.SaveToFile() 方法能将 PDF 文件保存为 Excel 格式。以下是如何使用 Spire.PDF for Python 将 PDF 文档转换为 Excel XLSX 格式并指定转换选项的具体步骤:
创建一个 PdfDocument 对象 使用 PdfDocument.LoadFromFile() 方法加载 PDF 文档。 创建一个 XlsxLineLayoutOptions 对象并将相应的参数传递给 XlsxLineLayoutOptions 类的构造函数以指定转换选项。 使用 PdfDocument.ConvertOptions.SetPdfToXlsxOptions() 方法应用转换选项。 使用 PdfDocument.SaveToFile() 方法将 PDF 文档保存为 Excel XLSX 格式。 from spire.pdf.common import * from spire.pdf import *
# 创建PdfDocument对象 pdf PdfDocument()
# 加载PDF文档 pdf.LoadFromFile(Sample.pdf)
# 创建 XlsxLineLayoutOptions 对象来指定转换选项 # 参数: convertToMultipleSheet, rotatedText, splitCell, wrapText, overlapText convertOptions XlsxLineLayoutOptions(True, True, False, True, False)
# 设置转换选项 pdf.ConvertOptions.SetPdfToXlsxOptions(convertOptions)
# 将PDF文档保存为Excel XLSX格式 pdf.SaveToFile(PdftoExcel.xlsx, FileFormat.XLSX) pdf.Close() 将 PDF保存为Excel后转换后可以轻松提取文档里面的数据。效果图如下
总结 除了将 PDF保存为Excel, Spire.PDF for python还支持将PDF 存为OFD, PDF文档转换为Word, 将PDF另存为图片如 PDF to PNG, JPGBMP等。