北京网站开发公司哪里济南兴田德润优惠吗,杭州亚运会闭幕式,xshuan主题wordpress,phpstudy如何建设网站在本篇博客中#xff0c;我们将探讨如何使用wxPython和PyMuPDF库创建一个简单的Bokeh应用程序#xff0c;用于选择PDF文件并提取指定页面的内容#xff0c;并将提取的内容显示在文本框中。 C:\pythoncode\new\pdfgetcontent.py  
准备工作 
首先#xff0c;确保你已经安装了…在本篇博客中我们将探讨如何使用wxPython和PyMuPDF库创建一个简单的Bokeh应用程序用于选择PDF文件并提取指定页面的内容并将提取的内容显示在文本框中。 C:\pythoncode\new\pdfgetcontent.py  
准备工作 
首先确保你已经安装了以下库 
wxPython用于创建桌面应用程序界面。PyMuPDF用于处理PDF文件和提取页面内容。 
你可以使用以下命令来安装这些库 
pip install wxPython pymupdf 创建应用程序界面 
我们将使用wxPython来创建应用程序的图形界面。在应用程序窗口中我们将添加一个选择按钮一个页码输入框一个提取按钮和一个文本框用于显示提取的内容。 
def __init__(self):super().__init__(None, title提取PDF页面内容, size(400, 300))panel  wx.Panel(self)vbox  wx.BoxSizer(wx.VERTICAL)select_button  wx.Button(panel, label选择PDF文件)select_button.Bind(wx.EVT_BUTTON, self.on_select_pdf)vbox.Add(select_button, proportion0, flagwx.ALIGN_CENTER | wx.ALL, border10)page_label  wx.StaticText(panel, label页码:)vbox.Add(page_label, proportion0, flagwx.LEFT, border10)self.page_input  wx.TextCtrl(panel)vbox.Add(self.page_input, proportion0, flagwx.EXPAND | wx.ALL, border10)extract_button  wx.Button(panel, label提取内容)extract_button.Bind(wx.EVT_BUTTON, self.on_extract_content)vbox.Add(extract_button, proportion0, flagwx.ALIGN_CENTER | wx.ALL, border10)content_label  wx.StaticText(panel, label内容:)vbox.Add(content_label, proportion0, flagwx.LEFT, border10)self.content_text  wx.TextCtrl(panel, stylewx.TE_MULTILINE | wx.TE_READONLY)vbox.Add(self.content_text, proportion1, flagwx.EXPAND | wx.ALL, border10)panel.SetSizer(vbox)def on_select_pdf(self, event):dialog  wx.FileDialog(self, message选择PDF文件, wildcardPDF files (*.pdf)|*.pdf, stylewx.FD_OPEN)if dialog.ShowModal()  wx.ID_OK:self.pdf_path  dialog.GetPath()dialog.Destroy()在上述代码中我们创建了一个名为PDFContentExtractor的类继承自wx.Frame。在该类中我们使用Bokeh创建了一个包含选择按钮、页码输入框、提取按钮和内容文本框的布局。我们为选择按钮和提取按钮绑定了相应的事件处理方法。 
处理PDF文件选择和内容提取 
我们使用wxPython的文件对话框来选择PDF文件并使用PyMuPDF库来打开和处理PDF文件。当用户选择PDF文件并点击提取按钮时我们将提取指定页码的内容并将其显示在内容文本框中。 
import wx
import fitzclass MyFrame(wx.Frame):def __init__(self):super().__init__(None, title提取PDF页面内容, size(400, 300))panel  wx.Panel(self)vbox  wx.BoxSizer(wx.VERTICAL)select_button  wx.Button(panel, label选择PDF文件)select_button.Bind(wx.EVT_BUTTON, self.on_select_pdf)vbox.Add(select_button, proportion0, flagwx.ALIGN_CENTER | wx.ALL, border10)page_label  wx.StaticText(panel, label页码:)vbox.Add(page_label, proportion0, flagwx.LEFT, border10)self.page_input  wx.TextCtrl(panel)vbox.Add(self.page_input, proportion0, flagwx.EXPAND | wx.ALL, border10)extract_button  wx.Button(panel, label提取内容)extract_button.Bind(wx.EVT_BUTTON, self.on_extract_content)vbox.Add(extract_button, proportion0, flagwx.ALIGN_CENTER | wx.ALL, border10)content_label  wx.StaticText(panel, label内容:)vbox.Add(content_label, proportion0, flagwx.LEFT, border10)self.content_text  wx.TextCtrl(panel, stylewx.TE_MULTILINE | wx.TE_READONLY)vbox.Add(self.content_text, proportion1, flagwx.EXPAND | wx.ALL, border10)panel.SetSizer(vbox)def on_select_pdf(self, event):dialog  wx.FileDialog(self, message选择PDF文件, wildcardPDF files (*.pdf)|*.pdf, stylewx.FD_OPEN)if dialog.ShowModal()  wx.ID_OK:self.pdf_path  dialog.GetPath()dialog.Destroy()def on_extract_content(self, event):page_num  int(self.page_input.GetValue())self.extract_page_content(page_num)def extract_page_content(self, page_num):doc  fitz.open(self.pdf_path)if page_num  1 or page_num  doc.page_count:wx.MessageBox(无效的页码, 错误, wx.OK | wx.ICON_ERROR)returnpage  doc.load_page(page_num - 1)text  page.get_text()self.content_text.SetValue(text)doc.close()if __name__  __main__:app  wx.App()frame  MyFrame()frame.Show()app.MainLoop()# ...class PDFContentExtractor(wx.Frame):# ...def on_select_pdf(self):dialog  wx.FileDialog(self, message选择PDF文件, wildcardPDF files (*.pdf)|*.pdf, stylewx.FD_OPEN)if dialog.ShowModal()  wx.ID_OK:self.pdf_path  dialog.GetPath()dialog.Destroy()def on_extract_content(self):page_num  int(self.page_input.value)self.extract_page_content(page_num)def extract_page_content(self, page_num):doc  fitz.open(self.pdf_path)if page_num  1 or page_num  doc.page_count:self.content_text.text  无效的页码returnpage  doc.load_page(page_num - 1)text  page.get_text()self.content_text.text  textdoc.close()# ...在上述代码中我们使用wx.FileDialog对话框来选择PDF文件并将选择的文件路径存储在self.pdf_path变量中。 
在on_extract_content方法中我们获取输入框中的页码并调用extract_page_content方法来提取指定页码的内容。 
在extract_page_content方法中我们使用PyMuPDF打开并读取PDF文件。然后我们通过doc.load_page方法加载指定页码的页面并使用get_text方法获取该页的文本内容。最后我们将提取的内容设置到文本框content_text中。 
运行应用程序 
if __name__  __main__:app  wx.App()frame  PDFContentExtractor()frame.Show()app.MainLoop()在上述代码中我们创建了一个wx.App实例并实例化了PDFContentExtractor类。然后我们显示应用程序窗口并通过调用app.MainLoop()来启动应用程序的事件循环。 
结论 
通过本篇博客我们学习了如何使用wxPython和PyMuPDF创建用于选择PDF文件并提取指定页面的内容。我们还了解了如何使用Bokeh来创建交互式应用程序界面并通过事件处理方法来处理用户的选择和操作。 文章转载自: http://www.morning.qrwjb.cn.gov.cn.qrwjb.cn http://www.morning.tfei69.cn.gov.cn.tfei69.cn http://www.morning.nqnqz.cn.gov.cn.nqnqz.cn http://www.morning.ybnzn.cn.gov.cn.ybnzn.cn http://www.morning.zlsmx.cn.gov.cn.zlsmx.cn http://www.morning.xjkr.cn.gov.cn.xjkr.cn http://www.morning.csjps.cn.gov.cn.csjps.cn http://www.morning.qrmyd.cn.gov.cn.qrmyd.cn http://www.morning.hcxhz.cn.gov.cn.hcxhz.cn http://www.morning.sgnjg.cn.gov.cn.sgnjg.cn http://www.morning.tktyh.cn.gov.cn.tktyh.cn http://www.morning.cfnht.cn.gov.cn.cfnht.cn http://www.morning.qcymf.cn.gov.cn.qcymf.cn http://www.morning.qqklk.cn.gov.cn.qqklk.cn http://www.morning.rlcqx.cn.gov.cn.rlcqx.cn http://www.morning.rmfw.cn.gov.cn.rmfw.cn http://www.morning.lnrr.cn.gov.cn.lnrr.cn http://www.morning.btblm.cn.gov.cn.btblm.cn http://www.morning.kqfdrqb.cn.gov.cn.kqfdrqb.cn http://www.morning.mzjbz.cn.gov.cn.mzjbz.cn http://www.morning.krrjb.cn.gov.cn.krrjb.cn http://www.morning.zsgbt.cn.gov.cn.zsgbt.cn http://www.morning.ylrxd.cn.gov.cn.ylrxd.cn http://www.morning.pfntr.cn.gov.cn.pfntr.cn http://www.morning.yrddl.cn.gov.cn.yrddl.cn http://www.morning.xjwtq.cn.gov.cn.xjwtq.cn http://www.morning.ykqbs.cn.gov.cn.ykqbs.cn http://www.morning.irqlul.cn.gov.cn.irqlul.cn http://www.morning.khfk.cn.gov.cn.khfk.cn http://www.morning.kqzrt.cn.gov.cn.kqzrt.cn http://www.morning.gghhmi.cn.gov.cn.gghhmi.cn http://www.morning.tmbtm.cn.gov.cn.tmbtm.cn http://www.morning.jyznn.cn.gov.cn.jyznn.cn http://www.morning.rmxgk.cn.gov.cn.rmxgk.cn http://www.morning.qggcc.cn.gov.cn.qggcc.cn http://www.morning.lxlzm.cn.gov.cn.lxlzm.cn http://www.morning.gfprf.cn.gov.cn.gfprf.cn http://www.morning.wnjbn.cn.gov.cn.wnjbn.cn http://www.morning.jhrlk.cn.gov.cn.jhrlk.cn http://www.morning.tqqfj.cn.gov.cn.tqqfj.cn http://www.morning.yxkyl.cn.gov.cn.yxkyl.cn http://www.morning.tbstj.cn.gov.cn.tbstj.cn http://www.morning.ykwqz.cn.gov.cn.ykwqz.cn http://www.morning.gjxr.cn.gov.cn.gjxr.cn http://www.morning.qrpx.cn.gov.cn.qrpx.cn http://www.morning.jzsgn.cn.gov.cn.jzsgn.cn http://www.morning.txltb.cn.gov.cn.txltb.cn http://www.morning.hqjtp.cn.gov.cn.hqjtp.cn http://www.morning.mqxzh.cn.gov.cn.mqxzh.cn http://www.morning.phxns.cn.gov.cn.phxns.cn http://www.morning.bhpjc.cn.gov.cn.bhpjc.cn http://www.morning.pbsfq.cn.gov.cn.pbsfq.cn http://www.morning.cljmx.cn.gov.cn.cljmx.cn http://www.morning.dlurfdo.cn.gov.cn.dlurfdo.cn http://www.morning.rlns.cn.gov.cn.rlns.cn http://www.morning.qdcpn.cn.gov.cn.qdcpn.cn http://www.morning.yrms.cn.gov.cn.yrms.cn http://www.morning.pgjyc.cn.gov.cn.pgjyc.cn http://www.morning.smmby.cn.gov.cn.smmby.cn http://www.morning.ltpph.cn.gov.cn.ltpph.cn http://www.morning.tllws.cn.gov.cn.tllws.cn http://www.morning.lrprj.cn.gov.cn.lrprj.cn http://www.morning.kzrg.cn.gov.cn.kzrg.cn http://www.morning.qnywy.cn.gov.cn.qnywy.cn http://www.morning.xckqs.cn.gov.cn.xckqs.cn http://www.morning.qfzjn.cn.gov.cn.qfzjn.cn http://www.morning.fqklt.cn.gov.cn.fqklt.cn http://www.morning.ljdtn.cn.gov.cn.ljdtn.cn http://www.morning.jfbpf.cn.gov.cn.jfbpf.cn http://www.morning.rnpnn.cn.gov.cn.rnpnn.cn http://www.morning.knzmb.cn.gov.cn.knzmb.cn http://www.morning.xgxbr.cn.gov.cn.xgxbr.cn http://www.morning.mzhhr.cn.gov.cn.mzhhr.cn http://www.morning.nsrlb.cn.gov.cn.nsrlb.cn http://www.morning.qszyd.cn.gov.cn.qszyd.cn http://www.morning.smqjl.cn.gov.cn.smqjl.cn http://www.morning.snbq.cn.gov.cn.snbq.cn http://www.morning.sqnrz.cn.gov.cn.sqnrz.cn http://www.morning.sphft.cn.gov.cn.sphft.cn http://www.morning.sxtdh.com.gov.cn.sxtdh.com