使用华为云鲲鹏部署Tesseract 工具,教你十分钟搞定上万字的文字识别,千万不要错过!

hw74991521 发表于 2020/07/23 16:33:10 2020/07/23
【摘要】 看视频,还可参与回帖互动领好礼活动!快来参与吧:https://bbs.huaweicloud.com/forum/thread-63290-1-1.html文字识别在生活中应用的场景很多,比如常见的汽车牌照识别,实名认证中对于身份证ID的自动识别,输入法的手写识别等等。实现文字识别的途径主要有三种,一个是我们自己手写代码,二是使用开源代码,三是调用云厂商的云服务。第一种,我们自己手写代码难...


20200710-190405(eSpace).png

看视频,还可参与回帖互动领好礼活动!快来参与吧:
https://bbs.huaweicloud.com/forum/thread-63290-1-1.html

文字识别在生活中应用的场景很多,比如常见的汽车牌照识别,实名认证中对于身份证ID的自动识别,输入法的手写识别等等。

实现文字识别的途径主要有三种,一个是我们自己手写代码,二是使用开源代码,三是调用云厂商的云服务。

第一种,我们自己手写代码难度较大。

第二种,给大家介绍。

第三种,调用云服务的方式。


最常用的文字识别引擎之一,就是目前由google维护的tesseract文字识别引擎,并且是开源的。

tesseract地址:https://github.com/tesseract-ocr/tesseract

我的tesseract是部署在云服务器上,当然大家也可以在本地电脑下载编译tesseract,没有任何差别。放在云服务器的好处就是,在其他任何城市使用任意一部手机或者电脑就可以远程使用该文字识别功能,不用重新配置。否则每个新设备都要重新配置编译tesseract,非常麻烦。

 

获取鲲鹏弹性云服务器

浏览器搜索“华为云”进入华为云官网,注册并且实名认证。

获取途径有两个,一是免费试用,二是购买使用

免费试用点击:首页->免费试用,选择 鲲鹏弹性云服务器KC1,每个账号只能免费试用一次。

购买使用点击:产品->弹性云服务器ECS,选择通用计算增强型KC1

获取成功后,点击控制台->弹性云服务器ECS,就可以看到我们的鲲鹏弹性云服务器,并且可以远程登录进行操作。系统装的是CentOS,用linux指令操作,也可以装windows系统,但是要购买2G内存以上的规格。


部署tesseract

华为云官方文档:https://www.huaweicloud.com/kunpeng/software/tesseract.html

部署的本质就是下载tesseract源代码以及依赖库,然后使用编译器编译生成可执行文件, 该可执行文件就可以直接识别文字图片了,原理非常简单。

华为云官网为我们提供了完整的部署步骤。

可以通过华为云端实验室练习部署过程。首页点击开发者->云端实验室,找到使用华为云鲲鹏弹性云服务器部署文字识别Tesseract实验。点击开始实验,整个过程直接复制粘贴左侧的指令,依次执行即可。整个过程与在云服务器操作一样。


【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区),文章链接,文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件至:cloudbbs@huaweicloud.com进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容。
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。