APP测评:云脉文档云识别,超好用的OCR识别工具!

举报
云脉OCR技术 发表于 2021/02/20 09:17:00 2021/02/20
【摘要】 如何管理职场办公中庞大的纸质文档信息?你需要一个随时可用、功能齐全的OCR文字识别工具。这里推荐你使用云脉文档云识别APP,它可以让你的手机变成随身携带的扫描仪、传真机、PDF转换器、Text文本提取工具……随着OCR技术的成熟和普及,市面上的文档识别工具也如雨后春笋,一茬接一茬。为何笔者要强烈推荐云脉文档云识别APP呢?下面我们分别从识别方式、识别引擎、图像处理、识别效率、识别结果处理等方...

如何管理职场办公中庞大的纸质文档信息?你需要一个随时可用、功能齐全的OCR文字识别工具。这里推荐你使用云脉文档云识别APP,它可以让你的手机变成随身携带的扫描仪、传真机、PDF转换器、Text文本提取工具……

随着OCR技术的成熟和普及,市面上的文档识别工具也如雨后春笋,一茬接一茬。为何笔者要强烈推荐云脉文档云识别APP呢?下面我们分别从识别方式、识别引擎、图像处理、识别效率、识别结果处理等方面来对云脉文档云识别软件进行测评。

测评一:识别方式

云脉文档云识别相对其他OCR识别软件的优势在于:识别方式不仅支持图片拍照识别和批量导入识别,还支持PDF文件导入识别。

在拍照识别方式的测试过程中,在部分亮光部分暗光的情形下拍摄,云脉OCR识别效果也非常不错,对环境的适应能力好。

测评二:识别引擎

目前,OCR识别技术针对“印刷体字符”来说已经很成熟了。但如果需要识别的文稿是手写体文字,而字迹又相对比较潦草,云脉文档云识别将是你不可或缺的工具。

云脉文档云识别采用先进的深度学习版OCR识别引擎,能够实现复杂场景下的文本识别,不仅支持印刷体识别,还支持手写体识别,可识别对象更丰富。

测评三:图像处理

众所周知,环境光线与文本资料本身是否整洁,字迹是否模糊,是否存在背景图片等都会影响到文字识别最终准确率。云脉文档云识别APP在图像处理方面,采用先进算法与技术架构增强识别数据,通过美化图像,锐化对比、降低噪点等方式可以获得更加清晰完整的图像,提升文字识别准确率。

针对识别后原文档存储还原的问题,云脉文档云识别支持裁切、倾斜校正、增强美化、旋转、压缩存储等图像美化处理,提高扫描图像质量助力原文档清晰存储,功能更强大。

测评四:识别效果

测试内容:分别测试在Doov朵唯 FreemeOS 9.0.0测试环境下,云脉文档云识别1.0.20210203 / H5文档云识别与ABBYY TextGrabber在印刷体拍照识别、印刷体导入识别、手写体导入识别等不同方式下的识别率。

1、印刷体拍照识别

TextGrabber,识别错误9个字符,识别率(606-9)/606=98.51%

云脉文档云识别,识别错误3个字符(606-3)/606=99.50%

2、印刷体导入识别

TextGrabber,识别错误6个字符,识别率(205-9)/205=95.61%

云脉文档云识别,识别错误11个字符,多为标点符号识别错误,识别率(205-11)/205=94.63%

3、手写体导入识别

TextGrabber,识别正确5个字符,识别率5/246=2.03%

云脉文档云识别,识别错误34个字符,识别率(246-34)/246=86.18%

综上可以看出云脉文档云识别的识别率优于ABBYY TextGrabber,特别是在手写体识别时,识别率高出84个点。

测评五:识别结果处理

在识别结果应用方面,云脉支持打印、内外部分享、双层PDF导出、图片快速检索,同时,还支持文档标签管理,提升文档查找效率,更便于纸质文档利用。

OCR录入文档的方式特别适用于政府办公、金融业务、教育资源等领域。选择一款适合自己的OCR工具,可以大大解放从业人员的双手,提升纸质文档电子化效率,提升办公效率。目前,厦门云脉已经在云脉OCR SDK开发者平台上开放文档识别接口,用户只需要接入API端口即可享受文档识别功能。

文档云识别https://www.yunmai.com/

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。