市场上几款热门OCR文档识别工具测试结果对比
【摘要】 OCR文档识别,是专门用于识别复印、手写文档并转化为可编辑的电子文档的一种技术,也是当代日常办公学习必不可少的“趁手”工具之一。选择一款高效的OCR识别工具,可以大大提升文档电子化录入效率。目前,国内不少人工智能识别技术研究公司推出OCR应用平台,使更多的人得以享受OCR技术带来的便利。上图是国内应用市场上几款热门文档识别工具以及他们的测试结果,主要测试不同OCR技术在面对模糊图片、清晰图片...
OCR文档识别,是专门用于识别复印、手写文档并转化为可编辑的电子文档的一种技术,也是当代日常办公学习必不可少的“趁手”工具之一。
选择一款高效的OCR识别工具,可以大大提升文档电子化录入效率。目前,国内不少人工智能识别技术研究公司推出OCR应用平台,使更多的人得以享受OCR技术带来的便利。
上图是国内应用市场上几款热门文档识别工具以及他们的测试结果,主要测试不同OCR技术在面对模糊图片、清晰图片时候的表现结果以及所需的平均时长。
在图片模糊(像素较低)的情况下:
腾讯优图、易道、云脉三方表现良好,识别率均达到了91.58%以上,其中云脉最高,识别率高达94.15%;文通、ABBYY表现令人大跌眼镜,文通识别率甚至不足50%。
在图片模糊(像素较高)的情况下:
腾讯优图、易道、云脉三方依然表现良好,易道、云脉识别率均达98%以上,区别在于云脉OCR深度学习平均用时远低于易道和腾讯优图,平均用时仅需2.11s。
在OCR技术测试过程中我们发现:
①在符号问题中,腾讯优图、百度云、易道均存在中英文全角半角混淆、符号识别错误、 句末符号漏识别等问题。
②ABBYY、文通在光线暗、模糊、小字体等情况下,容易识别成乱码或识别全错,拉伸、压扁字体,出现整行漏识别。
③易道断笔字情况下,容易识别错误,识别时间较长。
文档识别http://www.yunmai.com/
【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)