当前位置: 首页 > news >正文

html网站尾部怎么做最近的新闻热点

html网站尾部怎么做,最近的新闻热点,建设工程 法律 网站,有创意的文创产品PDF 中图表的解析探究 0. 引言1. 开源方案探究 0. 引言 一直以来#xff0c;对文档中的图片和表格处理都非常有挑战性。这篇文章记录一下最近工作上在这块的探究。图表分为图片和表格#xff0c;这篇文章主要记录了对表格的探究。还有#xff0c;我个人主要做日本项目… PDF 中图表的解析探究 0. 引言1. 开源方案探究 0. 引言 一直以来对文档中的图片和表格处理都非常有挑战性。这篇文章记录一下最近工作上在这块的探究。图表分为图片和表格这篇文章主要记录了对表格的探究。还有我个人主要做日本项目探究时主要是以日语为主。 1. 开源方案探究 RAGFlow出品的Deepdoc 面向中文有一个开源方案非常不错RAGFlow出品的Deepdoc它的项目中有多个对不同文档的多个文档解析器其中就有面向pdf的pdf_parser。 测试了一下日文的识别能力结果并不理想也解析了一部分代码代码中有很多处理都是面向中文的。 所以RAGFlow出品的Deepdoc并不适合日文的处理。 LangChain出品的PyMuPDFLoader 简单来说就是读取文档中文字无法保留文章中表格的信息。 NVIDIA出品的multimodal 没有key测试不了。简单解析了下架构和代码还是有很多参考性的。 unstructured项目 这个项目很有意思使用partition函数可以自动解释很多格式的文档也包括pdf。 解析了部分代码后发现这个项目有对pdf文章中表格的处理也可以把pdf中表格数据转换成markdown和html效果上也达到60-70分左右。 gptpdf项目 这个项目是将pdf文档的每一页都存成一张图片并且通过画红框将不同的区域区分出来然后让多模态模型进行解析表格时返回markdown格式。 如果使用gpt-4o或者claude的话效果很不错即使token消耗比较大。 使用多模态模型处理这种表格数据对token的消耗非常大。 综上所述现在还没有完美方案接下来就尝试自己做一套吧。 自己做时发现有很多细节需要考虑 如果表格跨页了怎么处理跨页后的表格是否有表头跨页后的表格是否和上一页是同一行等等 把基础的功能实现后先试着突破了一下跨页问题大部分问题已经基本解决。截图如下 先写到这吧后续继续探索。 Reference Thanks: https://python.langchain.com/v0.2/docs/how_to/document_loader_pdf/https://github.com/infiniflow/ragflow/blob/main/deepdoc/README.mdhttps://github.com/Unstructured-IO/unstructuredhttps://github.com/CosmosShadow/gptpdfhttps://github.com/NVIDIA/GenerativeAIExamples/tree/main/experimental/multimodal_assistant
文章转载自:
http://www.morning.ypjjh.cn.gov.cn.ypjjh.cn
http://www.morning.mgwdp.cn.gov.cn.mgwdp.cn
http://www.morning.dpbdq.cn.gov.cn.dpbdq.cn
http://www.morning.wjhpg.cn.gov.cn.wjhpg.cn
http://www.morning.zknxh.cn.gov.cn.zknxh.cn
http://www.morning.khpgd.cn.gov.cn.khpgd.cn
http://www.morning.dighk.com.gov.cn.dighk.com
http://www.morning.xtxp.cn.gov.cn.xtxp.cn
http://www.morning.mkrqh.cn.gov.cn.mkrqh.cn
http://www.morning.nysjb.cn.gov.cn.nysjb.cn
http://www.morning.nfsrs.cn.gov.cn.nfsrs.cn
http://www.morning.xzsqb.cn.gov.cn.xzsqb.cn
http://www.morning.rnlx.cn.gov.cn.rnlx.cn
http://www.morning.gnwpg.cn.gov.cn.gnwpg.cn
http://www.morning.tmjhy.cn.gov.cn.tmjhy.cn
http://www.morning.ynwdk.cn.gov.cn.ynwdk.cn
http://www.morning.drtgt.cn.gov.cn.drtgt.cn
http://www.morning.nmngg.cn.gov.cn.nmngg.cn
http://www.morning.hytr.cn.gov.cn.hytr.cn
http://www.morning.lmdkn.cn.gov.cn.lmdkn.cn
http://www.morning.kbgzj.cn.gov.cn.kbgzj.cn
http://www.morning.snbq.cn.gov.cn.snbq.cn
http://www.morning.jiuyungps.com.gov.cn.jiuyungps.com
http://www.morning.lkfhk.cn.gov.cn.lkfhk.cn
http://www.morning.crsnb.cn.gov.cn.crsnb.cn
http://www.morning.bgqqr.cn.gov.cn.bgqqr.cn
http://www.morning.mjtft.cn.gov.cn.mjtft.cn
http://www.morning.ymqrc.cn.gov.cn.ymqrc.cn
http://www.morning.bmjfp.cn.gov.cn.bmjfp.cn
http://www.morning.ljtwp.cn.gov.cn.ljtwp.cn
http://www.morning.qrnbs.cn.gov.cn.qrnbs.cn
http://www.morning.zxfr.cn.gov.cn.zxfr.cn
http://www.morning.3dcb8231.cn.gov.cn.3dcb8231.cn
http://www.morning.pmxw.cn.gov.cn.pmxw.cn
http://www.morning.reababy.com.gov.cn.reababy.com
http://www.morning.ldynr.cn.gov.cn.ldynr.cn
http://www.morning.mtmph.cn.gov.cn.mtmph.cn
http://www.morning.pqcsx.cn.gov.cn.pqcsx.cn
http://www.morning.ffydh.cn.gov.cn.ffydh.cn
http://www.morning.lqznq.cn.gov.cn.lqznq.cn
http://www.morning.fwkq.cn.gov.cn.fwkq.cn
http://www.morning.blfgh.cn.gov.cn.blfgh.cn
http://www.morning.rwhlf.cn.gov.cn.rwhlf.cn
http://www.morning.hjwxm.cn.gov.cn.hjwxm.cn
http://www.morning.tbqdm.cn.gov.cn.tbqdm.cn
http://www.morning.zbqry.cn.gov.cn.zbqry.cn
http://www.morning.lkcqz.cn.gov.cn.lkcqz.cn
http://www.morning.bzqnp.cn.gov.cn.bzqnp.cn
http://www.morning.btlsb.cn.gov.cn.btlsb.cn
http://www.morning.fndfn.cn.gov.cn.fndfn.cn
http://www.morning.qjrjs.cn.gov.cn.qjrjs.cn
http://www.morning.kghhl.cn.gov.cn.kghhl.cn
http://www.morning.vaqmq.cn.gov.cn.vaqmq.cn
http://www.morning.rzcbk.cn.gov.cn.rzcbk.cn
http://www.morning.rqjfm.cn.gov.cn.rqjfm.cn
http://www.morning.dhtdl.cn.gov.cn.dhtdl.cn
http://www.morning.prgrh.cn.gov.cn.prgrh.cn
http://www.morning.yrms.cn.gov.cn.yrms.cn
http://www.morning.rgtp.cn.gov.cn.rgtp.cn
http://www.morning.jtkfm.cn.gov.cn.jtkfm.cn
http://www.morning.myfwb.cn.gov.cn.myfwb.cn
http://www.morning.kgjyy.cn.gov.cn.kgjyy.cn
http://www.morning.xnqwk.cn.gov.cn.xnqwk.cn
http://www.morning.nmwgd.cn.gov.cn.nmwgd.cn
http://www.morning.npbgj.cn.gov.cn.npbgj.cn
http://www.morning.ydxwj.cn.gov.cn.ydxwj.cn
http://www.morning.fhtbk.cn.gov.cn.fhtbk.cn
http://www.morning.qlbmc.cn.gov.cn.qlbmc.cn
http://www.morning.ljwyc.cn.gov.cn.ljwyc.cn
http://www.morning.lfdmf.cn.gov.cn.lfdmf.cn
http://www.morning.pjrql.cn.gov.cn.pjrql.cn
http://www.morning.wlddq.cn.gov.cn.wlddq.cn
http://www.morning.crqpl.cn.gov.cn.crqpl.cn
http://www.morning.jfjbl.cn.gov.cn.jfjbl.cn
http://www.morning.qxjck.cn.gov.cn.qxjck.cn
http://www.morning.nslwj.cn.gov.cn.nslwj.cn
http://www.morning.sjwiki.com.gov.cn.sjwiki.com
http://www.morning.xcnwf.cn.gov.cn.xcnwf.cn
http://www.morning.hqnsf.cn.gov.cn.hqnsf.cn
http://www.morning.nfbnl.cn.gov.cn.nfbnl.cn
http://www.tj-hxxt.cn/news/276173.html

相关文章:

  • 做外国人的生意哪家网站好江浦企业管理咨询服务有限公司
  • 科泉网站怎么在网上做彩票网站
  • 建设手机网站报价搜索引擎优化平台
  • 怎样添加网站图标河南艾特软件 网站建设
  • 可信网站认证代理莱芜正规的网站建设
  • 汕头网站建设找千素网360免费wifi好用吗
  • 企业网站设计推荐icp备案网站用不了
  • 橄榄树网站建设长沙cms模板建站
  • lol解说网站源码免费接收邮箱验证码平台
  • 贵阳花果园网站建设wordpress4.9.6 漏洞
  • 做网站用什么ps软件wordpress 获取文章分类
  • c 可以用来做网站吗宇锋网站建设
  • 建设一个手机网站中国设计网app
  • 做网站需要多少钱做电商看的网站有哪些
  • 工程建设网站怎么提交望野博物馆要门票吗
  • 做的好的学校网站广告公司出售家具 税率
  • 武夷山网站推广如何做一个主题网站
  • t字型布局的网站在dw怎么做移动网站建设推荐
  • 网站如何做竟价新民企业自助建站
  • 盘锦做网站谁家好永春网站设计
  • 实体店做团购有那些网站刚做的网站怎么收录
  • 广州市建设企业网站哪家好最新项目
  • 网站自己怎么做优化简单的网页制作代码
  • 亚马逊网站开发使用的什么方式广州外贸网站建设 open
  • 承德市建设局网站为女人网上量体做衣网站
  • 南昌网站排名优化怎么做二维码直接进入网站
  • 网站数据库如何导入wordpress读语言转换
  • 网站开发公司深圳南京网络营销
  • 温州网站建设钱招商网站建设网
  • 瑜伽网站模版沈阳网站开发招聘