市场上几款热门OCR文档识别工具测试结果对比

举报
云脉OCR技术 发表于 2019/10/14 14:48:43 2019/10/14
【摘要】 OCR文档识别,是专门用于识别复印、手写文档并转化为可编辑的电子文档的一种技术,也是当代日常办公学习必不可少的“趁手”工具之一。选择一款高效的OCR识别工具,可以大大提升文档电子化录入效率。目前,国内不少人工智能识别技术研究公司推出OCR应用平台,使更多的人得以享受OCR技术带来的便利。上图是国内应用市场上几款热门文档识别工具以及他们的测试结果,主要测试不同OCR技术在面对模糊图片、清晰图片...

OCR文档识别,是专门用于识别复印、手写文档并转化为可编辑的电子文档的一种技术,也是当代日常办公学习必不可少的“趁手”工具之一。

选择一款高效的OCR识别工具,可以大大提升文档电子化录入效率。目前,国内不少人工智能识别技术研究公司推出OCR应用平台,使更多的人得以享受OCR技术带来的便利。

图片2.png

上图是国内应用市场上几款热门文档识别工具以及他们的测试结果,主要测试不同OCR技术在面对模糊图片、清晰图片时候的表现结果以及所需的平均时长。

在图片模糊(像素较低)的情况下:

腾讯优图、易道、云脉三方表现良好,识别率均达到了91.58%以上,其中云脉最高,识别率高达94.15%;文通、ABBYY表现令人大跌眼镜,文通识别率甚至不足50%。

在图片模糊(像素较高)的情况下:

腾讯优图、易道、云脉三方依然表现良好,易道、云脉识别率均达98%以上,区别在于云脉OCR深度学习平均用时远低于易道和腾讯优图,平均用时仅需2.11s。

在OCR技术测试过程中我们发现:

①在符号问题中,腾讯优图、百度云、易道均存在中英文全角半角混淆、符号识别错误、 句末符号漏识别等问题。

②ABBYY、文通在光线暗、模糊、小字体等情况下,容易识别成乱码或识别全错,拉伸、压扁字体,出现整行漏识别。

③易道断笔字情况下,容易识别错误,识别时间较长。

文档识别http://www.yunmai.com/


【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。