怎样做才能让自己的网站,深圳便宜的网站建设,推荐网站网页,网站建设流程的步骤这几年的AI的发展#xff0c;使得文字识别难度大大降低、精度大大的提高。百度飞浆就是一个非常好的AI框架#xff0c;而且是开源的。 我们利用百度飞浆就能快速简单的实现文字识别功能#xff0c;几行代码就可以集成。
其中百度飞浆的PaddleOCR#xff0c;就是专门针对文…这几年的AI的发展使得文字识别难度大大降低、精度大大的提高。百度飞浆就是一个非常好的AI框架而且是开源的。 我们利用百度飞浆就能快速简单的实现文字识别功能几行代码就可以集成。
其中百度飞浆的PaddleOCR就是专门针对文本识别的开发套件包含的功能有文本失败、文本检测、表格识别支持中英文数字组合的识别、竖排、长文本识别而且还针对小图做了优化大大提升准确率。
下面我们一起来看看如何使用百度飞浆实现文字识别
一、新建项目
新建一个控制台项目。 二、安装依赖包
通过NuGet安装依赖包PaddleOCRSharp。 PaddleOCRSharp是Github的开源项目是基于百度飞浆C代码封装的.Net类库其中支持PaddleOCR版本是**release2.5。**如果大家需要最新版本或者其他模型也可以自行封装。
项目地址https://github.com/raoyutian/PaddleOCRSharp
安装依赖后我们就可以看到很多dll库。 三、编写识别代码
识别图片的文字并打印代码如下
using PaddleOCRSharp;PaddleOCREngine engine;//中英文模型V3模型
OCRModelConfig config null;//OCR参数
OCRParameter oCRParameter new OCRParameter();
oCRParameter.cpu_math_library_num_threads 6;//预测并发线程数
oCRParameter.enable_mkldnn true;//是否使用mkldnn模型
oCRParameter.cls false; //是否执行文字方向分类
oCRParameter.use_angle_cls false;//是否开启方向检测
oCRParameter.det_db_score_mode true;//是否使用多段线即文字区域是用多段线还是用矩形
oCRParameter.det_db_unclip_ratio 1.6f;
oCRParameter.max_side_len 2000;//初始化OCR引擎
engine new PaddleOCREngine(config, oCRParameter);var imagebyte File.ReadAllBytes(1.png);
OCRResult ocrResult engine.DetectText(imagebyte);
Console.WriteLine(ocrResult.Text);四、执行效果如下 识别速度、效果还是非常好的。
- End -
推荐阅读
推荐一个支持低代码开发的OA开源系统
一个基于.Net CoreVueElement Ui开发的OA系统
一个基于NetCore模块化、多租户CMS系统
一个基于EntityFrameworkCoreLucene实现的全文搜索引擎库
盘点6个.NetCoreVue前后端分离的开源项目