建议使用以下浏览器,以获得最佳体验。 IE 9.0+以上版本 Chrome 31+ 谷歌浏览器 Firefox 30+ 火狐浏览器
设置昵称

在此一键设置昵称,即可参与社区互动!

确定
我再想想
选择版块
AI活动 主题:757帖子:123704

【AI人工智能全栈成长计划】

【问答官3阶段】在训练OCR框架时,会有什么因素影响准确率?

franco5257... 2020/11/12 506

自己在训练OCR框架时,会有什么因素影响准确率?该怎么调整这些参数来提高性能呢?

回复4

2020/11/13 08:38

比如多种语言、图像不清晰、颜色过多、缺损严重、图像歪曲等等,

提高性能的话可以减少语言种类、更正图像方向、修补缺漏、提高画质等等。

andyleung
0 0
2020/11/13 15:40

OCR要面对的挑战主要是两个方面: 这两个方面的挑战都会比较影响到OCR的准确率的~

汉字字符识别

汉字字符的识别难度相比较英文字符要更大,字符的识别过程可以近似为分类,引文字符的分类数远小于汉字单字的数量,所以分类的难度更高。除此之外,多语言混合也是字符分类任务中的挑战,字符识别更加复杂

手写字符识别

印刷字体遵循固定的规则,而手写字符的识别相比较就更加复杂,每个人的书写习惯都不同,同一个人书写同样的字符也不完全相同,识别难度大大增加。


Felix666
0 0
2020/11/13 17:58

以下均会影响训练的准确率:

1,图片的预处理效果的好坏

2,进行文本检测时使用的算法的精度及其相关参数

3,文字框的位置精度和角度精度

4,字符分类算法的精度及其相关参数

2020/11/27 18:18

1.检查源图像质量:

我们的专家确保原始源图像足够可见,以便它们可以获得更好的OCR结果。首先扫描模糊图像是没有意义的。OCR应该能够识别高对比度,字符边界,像素噪声和对齐字符。

2.选择最好的OCR模型:

众所周知,OCR主要负责理解给定图像中的文本,因此有必要选择能够以更好的方式预处理图像的正确图像。我们的软件做得很好。尽管如此,我们仍然不断更新它,以使结果更准确。

3.将图像缩放到合适的大小:

我们尝试将图像缩放到大约300 dpi的标准尺寸。任何低于此尺寸的图像都会产生不清晰的结果,而高于600 dpi的图像会使输出文件变大而质量不高。

4.增强图像对比度:

在OCR中扫描图像之前,对比度和密度是需要考虑的重要因素。我们处理图像以增强这些因素以获得更清晰的输出。

5.消除图像中的噪音:

如果图像中存在背景或前景噪声,我们会将其删除,以便我们获得高质量的数据提取。

6.正确准备和处理文件:

我们确保可以将任何大小的文档加载到扫描仪中。此外,我们的捕获软件减少了文档准备时间,因为它们被送入这些扫描仪。

7.纠正和分析页面布局:

在预处理阶段,重要的是校正页面以使字线是水平的。我们尝试降低页面布局的复杂性,以帮助OCR以更准确的方式识别文本边界。

8.分析角色边缘:

捕获工具和光学字符识别软件必须能够优化字符边缘,以便在提取结果时所需的劳动力最少。

9.使用过滤器,数据库和同义词库:

应特别注意减少错误。这就是为什么我们使用语言过滤器,数据库和同义词库,以便提取的结果有意义,不需要进一步检查。


上划加载中
直达楼层
标签
您还可以添加5个标签
  • 没有搜索到和“关键字”相关的标签
  • 云产品
  • 解决方案
  • 技术领域
  • 通用技术
  • 平台功能
取消

采纳成功

您已采纳当前回复为最佳回复

franco52576

发帖: 31粉丝: 0

发消息 + 关注

发表于2020年11月12日 21:47:07 506 4
直达本楼层的链接
楼主
显示全部楼层
[AI人工智能全栈成长计划] 【问答官3阶段】在训练OCR框架时,会有什么因素影响准确率?

自己在训练OCR框架时,会有什么因素影响准确率?该怎么调整这些参数来提高性能呢?

机器学习 OCR

举报
分享

分享文章到朋友圈

分享文章到微博

采纳成功

您已采纳当前回复为最佳回复

蜡笔不辣

发帖: 31粉丝: 6

发消息 + 关注

发表于2020年11月13日 08:38:37
直达本楼层的链接
沙发
显示全部楼层

比如多种语言、图像不清晰、颜色过多、缺损严重、图像歪曲等等,

提高性能的话可以减少语言种类、更正图像方向、修补缺漏、提高画质等等。

点赞 评论 引用 举报

采纳成功

您已采纳当前回复为最佳回复

andyleung

发帖: 1023粉丝: 83

发消息 + 关注

发表于2020年11月13日 15:40:26
直达本楼层的链接
板凳
显示全部楼层

OCR要面对的挑战主要是两个方面: 这两个方面的挑战都会比较影响到OCR的准确率的~

汉字字符识别

汉字字符的识别难度相比较英文字符要更大,字符的识别过程可以近似为分类,引文字符的分类数远小于汉字单字的数量,所以分类的难度更高。除此之外,多语言混合也是字符分类任务中的挑战,字符识别更加复杂

手写字符识别

印刷字体遵循固定的规则,而手写字符的识别相比较就更加复杂,每个人的书写习惯都不同,同一个人书写同样的字符也不完全相同,识别难度大大增加。


点赞 评论 引用 举报

采纳成功

您已采纳当前回复为最佳回复

Felix666

发帖: 51粉丝: 2

发消息 + 关注

发表于2020年11月13日 17:58:21
直达本楼层的链接
地板
显示全部楼层

以下均会影响训练的准确率:

1,图片的预处理效果的好坏

2,进行文本检测时使用的算法的精度及其相关参数

3,文字框的位置精度和角度精度

4,字符分类算法的精度及其相关参数

点赞 评论 引用 举报

采纳成功

您已采纳当前回复为最佳回复

漫游寰宇外

发帖: 6粉丝: 0

发消息 + 关注

发表于2020年11月27日 18:18:24
直达本楼层的链接
5#
显示全部楼层

1.检查源图像质量:

我们的专家确保原始源图像足够可见,以便它们可以获得更好的OCR结果。首先扫描模糊图像是没有意义的。OCR应该能够识别高对比度,字符边界,像素噪声和对齐字符。

2.选择最好的OCR模型:

众所周知,OCR主要负责理解给定图像中的文本,因此有必要选择能够以更好的方式预处理图像的正确图像。我们的软件做得很好。尽管如此,我们仍然不断更新它,以使结果更准确。

3.将图像缩放到合适的大小:

我们尝试将图像缩放到大约300 dpi的标准尺寸。任何低于此尺寸的图像都会产生不清晰的结果,而高于600 dpi的图像会使输出文件变大而质量不高。

4.增强图像对比度:

在OCR中扫描图像之前,对比度和密度是需要考虑的重要因素。我们处理图像以增强这些因素以获得更清晰的输出。

5.消除图像中的噪音:

如果图像中存在背景或前景噪声,我们会将其删除,以便我们获得高质量的数据提取。

6.正确准备和处理文件:

我们确保可以将任何大小的文档加载到扫描仪中。此外,我们的捕获软件减少了文档准备时间,因为它们被送入这些扫描仪。

7.纠正和分析页面布局:

在预处理阶段,重要的是校正页面以使字线是水平的。我们尝试降低页面布局的复杂性,以帮助OCR以更准确的方式识别文本边界。

8.分析角色边缘:

捕获工具和光学字符识别软件必须能够优化字符边缘,以便在提取结果时所需的劳动力最少。

9.使用过滤器,数据库和同义词库:

应特别注意减少错误。这就是为什么我们使用语言过滤器,数据库和同义词库,以便提取的结果有意义,不需要进一步检查。


点赞 评论 引用 举报

游客

您需要登录后才可以回帖 登录 | 立即注册

结贴

您对问题的回复是否满意?
满意度
非常满意 满意 一般 不满意
我要反馈
0/200