市场上热门OCR文档识别工具性能大比拼

举报
云脉OCR技术 发表于 2019/10/11 16:33:58 2019/10/11
【摘要】 人工智能识别应用正处于极速发展的状态,尤其是OCR技术,小到票据文件录入,大到图书档案入库,都离不开人工智能OCR技术的支持。一款好用的OCR文字识别工具对我们日常办公来说至关重要。文档识别工具到底好不好用,要看它的识别率,识别所用时长,以及环境适用性。下面列出三款日常使用的OCR文档识别工具,来进行一次全方位的对比,看看识别效果如何,如何选择看官按需选择。1.清晰度对比测试清晰度对比:50...

人工智能识别应用正处于极速发展的状态,尤其是OCR技术,小到票据文件录入,大到图书档案入库,都离不开人工智能OCR技术的支持。

一款好用的OCR文字识别工具对我们日常办公来说至关重要。文档识别工具到底好不好用,要看它的识别率,识别所用时长,以及环境适用性。

下面列出三款日常使用的OCR文档识别工具,来进行一次全方位的对比,看看识别效果如何,如何选择看官按需选择。

1.清晰度对比测试

清晰度对比:500W/800W

测试文字:简体中文(大字体)

图片1.png 

云脉文档(安卓)不管是500W清晰度还是800W清晰度,中文识别率≥99.3%,用时≤2.91S,不论是识别准确率还是识别用时表现都相对突出,综合表现上佳。

ABBYY(安卓)在清晰度为800W的环境下,中文识别率≥95.71%,用时≤6.05S,但是在500W清晰度下,表现不是那么理想,识别率仅有80%,平均用时6.18S,有待加强。

合合_安卓扫描全能王,根据上图可以看出,不论是500W还是800W情绪度下,合合文档识别率都在90%以上,相较于云脉的识别率,合合文档识别表现中庸,且更大的短板在于识别时间,尤其是在清晰度800W的时候,平均用时14.20秒,远高于另外两款文档识别工具。

2.中英文文字测试对比

测试文字:中文、英文、中英混合

图片2.pngspacer.gif

不同的清晰度下,云脉、合合、ABBYY的表现差距明显,那么在相同的清晰度下,三款文档识别工具对中文、英文、中英混合文档内容的识别效果如何呢?

从图2可以看出,云脉文档不管是中文、英文还是中英混合文档,其识别准确率都达到99.15%以上,用时在2.59-4.62秒之间;ABBYY虽然英文识别率达到了100%,但在中文识别环节却严重拖后腿,识别率仅有80%;合合依然表现中庸,只是英文识别用时平均16.20秒,严重影响日常工作效率。

3.系统资源占用对比

云脉、合合、BBYY当前市场上最新版本软件大小

spacer.gif图片3.png

一款好的文字识别工具,除了要具备高准确率,高速识别率、工具易用性之外,还要有一点就是要“占存小”。试问如今谁手机里没十几二十个工作聊天娱乐app?在高效识别的前提下,文档识别工具占存越小,越轻便,越容易被大众接受和喜爱。

在功能完备的前提下,云脉文档占存≤ABBYY≤合合。看官在选择适合自己的办公工具的时候,要考虑到工具对手机/电脑系统的的影响,过多的占用内存会导致手机耗电量增加,同时拖慢系统运行速度。

技术支持:400 878 8295

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。