#化鲲为鹏,我有话说#使用华为云鲲鹏弹性云服务器部署文字识别Tesseract

举报
G-washington 发表于 2019/11/26 16:49:37 2019/11/26
【摘要】 今日鲲鹏论坛小助发了一篇云端体验帖子,迫不及待的我进行了一把ecs体验。分配的弹性云服务器规格:2vCPUs|4G|CentOS6.5 64bit首先登录上华为云官网,在控制台找到分配的弹性云服务器复制IP,打开桌面上的XFce,执行如下代码,将EIP修改为IP:LANG=en_us.UTF-8 ssh root@EIP输入密码,配置Tesseract环境所需要的依赖包,例如构建系统需要的A...

分配的弹性云服务器规格:2vCPUs|4G|CentOS6.5 64bit

首先登录上华为云官网,在控制台找到分配的弹性云服务器复制IP,打开桌面上的XFce,执行如下代码,将EIP修改为IP:

LANG=en_us.UTF-8 ssh root@EIP

image.png

输入密码,配置Tesseract环境所需要的依赖包,例如构建系统需要的Auto make,创建库的工具libtools、C++编译器、图片库等等

输入如下命令行进行相关依赖包安装:

yum install automake libtool gcc-c++ libjpeg-devel libpng-devel libtiff-devel -y

image.png

leptonica是tesserart的依赖库,使用它可以实现tesserart识别串的编译

下载leptonica安装包,执行如下命令行:

wget https://sandbox-experiment-resource.obs.cn-north-1.myhuaweicloud.com/kunpeng-tesseract/leptonica-1.78.0.tar.gz

image.png

解压安装包,输入以下命令行:

tar -xvf leptonica-1.78.0.tar.gz

image.png

编译安装,先进入leptonica文件夹输入命令行:

cd leptonica-1.78.0

./configure --prefix=/usr/ && make -j4 && make install

image.png

配置leptonica所需要的环境变量:

进入:vim etc\profile

image.png

进入文件后在键盘上按shift+G键,跳转到文档的底部,将光标移动到done下一行,输入i进入编写状态,将下面的代码输入进去

export PKG_CONFIG_PATH=/usr/lib/pkgconfig

image.png

之后按esc退出编辑状态,输入:wq退出文档,输入下面的命令行进行个保存运行。

source /etc/profile && ldconfig

image.png

配置tesseract

进入src文件,下载tesseract,输入如下命令行:

cd /usr/local/src
wget https://sandbox-experiment-resource.obs.cn-north-1.myhuaweicloud.com/kunpeng-tesseract/tesseract-4.0.0.tar.gz

image.png

解压压缩包:

tar -xvf tesseract-4.0.0.tar.gz

image.png

打开文件夹进行编译安装,输入如下命令行:

cd tesseract-4.0.0

./autogen.sh && ./configure && make -j4 && make install

image.png

编译成功后,进入root账户下,下载英文语言包:

cd /root
wget https://sandbox-experiment-resource.obs-website.cn-north-1.myhwclouds.com/kunpeng-tesseract/eng.traineddata

image.png

下载中文语言包:

wget https://sandbox-experiment-resource.obs-website.cn-north-1.myhwclouds.com/kunpeng-tesseract/chi_sim.traineddata

image.png

tesserart识别语音包需要将语音包放置到“usr/local/share/tessdata”这个目录下一般与tesserart识别:

cp eng.traineddata /usr/local/share/tessdata -r && cp chi_sim.traineddata /usr/local/share/tessdata -r

image.png

接下来让我们下载个鲲鹏文字图片来进行个测试吧:

wget https://portal-www-software.obs.cn-north-1.myhuaweicloud.com:443/kunpeng_chi.bmp

image.png

执行以下命令让我们来查看下测试结果:

tesseract -l chi_sim kunpeng_chi.bmp res_chi && cat res_chi.txt

image.png

接下来让我们测试下英文测试结果:

下载英文测试图片

wget https://portal-www-software.obs.cn-north-1.myhuaweicloud.com:443/kunpeng.bmp

执行如下命令行进行测试:

tesseract kunpeng.bmp result && cat result.txt

image.png

至此我们tesserart文字识别搭建完成!


【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。