当前位置: 首页 > news >正文

西安网站维保公司国产免费crm系统有哪些在线

西安网站维保公司,国产免费crm系统有哪些在线,网站设计公司推荐,b2b平台有哪些免费的前处理: DocTr: Document Image Transformer for Geometric Unwarping and Illumination Correction (1)几何矫正 给定一张存在几何和光照畸变的文档图像,我们首先用一个包含六个卷积模块的特征提取器对其进行特征提取&#xf…

前处理

DocTr: Document Image Transformer for Geometric Unwarping and Illumination Correction

(1)几何矫正

给定一张存在几何和光照畸变的文档图像,我们首先用一个包含六个卷积模块的特征提取器对其进行特征提取,并降低特征图分辨率至输入图像的1/8尺度,以保证网络的推理效率。然后,我们将提取的特征图展平后,输入至Transformer编码器,解码器,以及我们设计的可学习的上采样模块,得到坐标位移矩阵。最后,我们用对坐标位移矩阵对输入的图像进行几何矫正(即基于双线性插值的在输入图像上按坐标进行像素重采样)。

(2)光照恢复

给定一张几何矫正输出的高分辨率图像,我们首先将其切分成相互之间有1/8重叠的图像块。然后,我们将每一个图像块输入至卷积特征提取器,Transformer编码器,解码器,以及卷积输出头,从而输出光照恢复的图像块。最后,我们将每一个恢复的图像块进行空间上的拼接,完成文档图像的光照恢复。

1、版面分析

使用轻量模型PP-PicoDet检测模型实现版面各种类别的检测。

数据集:

英文:publaynet数据集的训练集合中包含35万张图像,验证集合中包含1.1万张图像。总共包含5个类别。

中文:CDLA据集的训练集合中包含5000张图像,验证集合中包含1000张图像

2、文本分析

文本检测:改进了基于分割的DBNet (Differentiable Binarization)

数据集:ICDAR 2015 数据集包含1000张训练图像和500张测试图像。

文本识别:SVTR_LCNet(将基于Transformer的SVTR网络和轻量级CNN网络PP-LCNet 融合的一种轻量级文本识别网络)

数据集:

 

 3、表格

1. 文字检测模型:用于检测表格里的文本

2. 文字识别模型:用于对检测到的文本进行识别

3. SLANet模型用于预测表格结构的HTML信息和表格单元格坐标

数据集:

PubTabNet数据集的训练集合中包含50万张图像,验证集合中包含0.9万张图像

好未来表格识别竞赛数据集的训练集合中包含1.6万张图像。验证集未给出可训练的标注。

参考来源: GitHub - PaddlePaddle/PaddleOCRhttps://github.com/PaddlePaddle/PaddleOCR

http://www.tj-hxxt.cn/news/35531.html

相关文章:

  • cps推广网站广州网站设计
  • 网站做支付按流量付费吗优化模型
  • 做百度网站如何收费今日军事新闻头条视频
  • 怎样讲卖灯的网站做的好网站优化排名查询
  • 网站设计制造中国足彩网竞彩推荐
  • 如何为一个网站做app软文平台有哪些
  • 一个卖时时彩做号方法的网站今日国际新闻事件
  • 咸阳做企业网站seo推广教程
  • 免费自助建网站市场营销策划方案范文
  • 织梦网站调整网络公司网站建设
  • 阿里云1M做网站淘宝数据查询
  • 织梦做的网站老是被黑关键词优化推广排名多少钱
  • 门户网站建设检察国内时事新闻
  • 朔州网站seoapp推广接单发布平台
  • 做电影网站怎样赚钱吗手机百度识图网页版入口
  • 成都网站建设需多少钱网页快速收录
  • 免费建网站中文域名百度seo关键词优化费用
  • 石家庄网站建设推广公司电话福州模板建站哪家好
  • 外包公司做网站图片哪里整的百度云登录入口
  • 网站建设色彩搭配关键词采集网站
  • flash网站推荐云南网络推广seo代理公司
  • 一流的网站建设哪家好郑州网络推广服务
  • 新建门户网站的建设自查少儿编程培训机构排名前十
  • 188自助建站系统视频app推广
  • 美国公司注册代办seo需要懂代码吗
  • 企业建设网站的主要目的谷歌推广平台
  • 网站设计答辩ppt宁波网站推广方式怎么样
  • 做网站设计的长宽一般是多少百度搜索软件
  • 北京国互网网站建设电话软文推广经典案例
  • 做的新网站网上搜不到排名优化是怎么做的