当前位置: 首页 > news >正文

什么网站做的最好东莞网络营销

什么网站做的最好,东莞网络营销,广州网站设计制作,副业做网站软件概述 OCR技术存在两个步骤:文字检测和文字识别,而end-to-end完成这两个步骤的方法就是text spotter。 文字检测数据集摘要 daaset语言体量特色MTWI中英文20k源于网络图像,主要由合成图像,产品描述,网络广告(淘宝)MS…

概述

OCR技术存在两个步骤:文字检测和文字识别,而end-to-end完成这两个步骤的方法就是text spotter。

文字检测数据集摘要

daaset语言体量特色
MTWI中英文20k源于网络图像,主要由合成图像,产品描述,网络广告(淘宝)
MSRA-TD500中英文
SynthText800k img + 8000k text合成数据
CTW1500中文32k野外场景
ICDAR 2015
ICDAR 2019-ReCTS中文标识牌上的文字(店铺名等)
ICDAR2019-ArT中英文组合Total-Text+SCUT-CTW1500+Baidu Curved Scene Text
ICDAR2019-LSVT中英文30k full annotation + 40k weakly annotationLarge-scale Street View Text with Partial Labeling,
ICDAR2017-DeTextText Extraction from Biomedical Literature Figures, 生物医学文献图形中的文本提取
ICDAR 2011 (Born-Digital Images)、ICDAR 2017英文
CurvedSynText150k英文
Total-Text英文+少量中文1.5k各种形状的文本,包括水平的,多取向的和弯曲的
Lecture Video DB
IMGURhandwriting
KAIST
ILST印度语言三种印度语言(Devanagari 、 Telugu 和Malayalam)的场景文本识别数据集
VinText
BID巴西身份证件数据集
RCTW12k+手机野外拍摄,包括街景、海报、菜单、室内场景以及手机应用的截图
HierText (Google)英文自然图像或者文献

OCR方法

前沿text spotter方法

  • PSENet、PAN、PAN++(PAMI 2021)
  • DeepSolo (CVPR2023)

方法框架

  • mmocr: 集成方法并不是最新的(2022年以前的),其中预训练方法只支持英文,文字检测方法还可以检测出中文,文字识别无法识别中文,text spotter尚未介入到统一的接口中。

Github high star

  • tesseract(57.7k star):大概率是文字识别模型,C/C++,提供command line tool。
  • PaddleOCR(38.1k star): 80+ language support。提供轻量化、提供在线demo(后面有测试),provide data annotation and synthesis tools, support training and deployment among server, mobile, embedded and IoT devices。
  • EasyOCR(21.8k star): pytorch based,文字检测基于CRAFT,识别基于LSTM+Transformer。Ready-to-use OCR with 80+ supported languages and all popular writing scripts including Latin, Chinese, Arabic, Devanagari, Cyrillic and etc.提供 在线DEMO。
  • tesseract.js (33.2k star): pure Javascript OCR for more than 100 Languages。
  • UniOCR (20.6k star): 提供一个界面。
  • OCRmyPDF (11.8k star): 解析pdf图片,基于tesseract。

PaddleOCR(PP-OCRv4)测试图如下

(1)弧形分布文字检测和识别都不准
PPOCRv4
(2) 放大了也识别不出来,应该和training data相关

Reference

  • https://mmocr.readthedocs.io/en/dev-1.x/
http://www.tj-hxxt.cn/news/44591.html

相关文章:

  • wordpress怎么改搜索引擎微信seo是什么意思
  • 有哪些做微场景的没费网站seo教程搜索引擎优化入门与进阶
  • 网站留言板怎么做phpsqlgoogle play应用商店
  • 海淀区住房和城乡建设委员会官方网站百度最新财报
  • 桂林网站建设招聘杭州网站seo
  • 莱特币做空国外网站百度站长工具验证
  • 如何做网站卖产品搜索引擎提交入口网址
  • 网站学做糕点的课程网络推广外包代理
  • 徐州服饰网站建设app地推接单平台有哪些
  • web3培训石家庄网络seo推广
  • 大连中山区网站建设网络营销服务公司
  • 如何做网站代理seo交流中心
  • 模块化建站工具有效获客的六大渠道
  • 小说网站开发环境那个号网络营销技巧和营销方法
  • 做本地团购网站怎么样网站推广投放
  • 免费网站奖励自己的软件怎么优化
  • 大连做网站绍兴厂商江西优化中心
  • 网站公司怎么找客户优化站点
  • 武汉seo技术是什么快速seo排名优化
  • 响应式网站开发流程图百度推广收费
  • 网站建设人文环境免费web服务器网站
  • 廊坊网站推广北京百度seo
  • 湖南建设局网站网站建设网络公司
  • 怎么建设两个大淘客网站seo推广小分享
  • 网站设计需要什么seo推广哪家服务好
  • thinkphp做的网站源码国内新闻摘抄2022年
  • 网站正建设中搜索引擎营销的基本方法
  • 提升网站关键词排名网络营销策划的具体流程是
  • wordpress链接自定义后文章打不开湖南企业seo优化首选
  • 展览公司网站模板关键词批量调词 软件