网站公司的利润,军事热点事件2022,杭州市建设工程交易中心网站,网站后台用esayui做基于MinerU的PDF解析API
- MinerU的GPU镜像构建
- 基于FastAPI的PDF解析接口支持一键启动#xff0c;已经打包到镜像中#xff0c;自带模型权重#xff0c;支持GPU推理加速#xff0c;GPU速度相比CPU每页解析要快几十倍不等
主要功能
删除页眉、页脚、脚注、页码等元素已经打包到镜像中自带模型权重支持GPU推理加速GPU速度相比CPU每页解析要快几十倍不等
主要功能
删除页眉、页脚、脚注、页码等元素保持语义连贯对多栏输出符合人类阅读顺序的文本保留原文档的结构包括标题、段落、列表等提取图像、图片标题、表格、表格标题自动识别文档中的公式并将公式转换成latex自动识别文档中的表格并将表格转换成latex乱码PDF自动检测并启用OCR支持CPU和GPU环境支持windows/linux/mac平台
具体原理
请见PDF-Extract-Kit:https://github.com/opendatalab/PDF-Extract-Kit/blob/main/README-zh_CN.md PDF文档中包含大量知识信息然而提取高质量的PDF内容并非易事。为此我们将PDF内容提取工作进行拆解
布局检测使用LayoutLMv3模型进行区域检测如图像表格,标题,文本等公式检测使用YOLOv8进行公式检测包含行内公式和行间公式公式识别使用UniMERNet进行公式识别表格识别使用StructEqTable进行表格识别光学字符识别使用PaddleOCR进行文本识别
镜像地址 阿里云地址docker pull registry.cn-beijing.aliyuncs.com/quincyqiang/mineru:0.2-models dockerhub地址docker pull quincyqiang/mineru:0.2-models 启动命令
docker run -itd --namemineru_server --gpusall -p 8888:8000 quincyqiang/mineru:0.2-models 具体截图请见博客https://blog.csdn.net/yanqianglifei/article/details/141979684
启动日志 输入参数
访问地址
http://localhost:8888/docshttp://127.0.01:8888/docs解析效果 返回内容字段包括:dict_keys([‘layout’, ‘info’, ‘content’]) 其中content是一个字典列表
{type: text, text: 现在我们知道价值实体就是劳动劳动量的尺度就是劳动持续时间。, page_idx: 5
}