- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

#化鲲为鹏，我有话说#使用华为云鲲鹏弹性云服务器部署文字识别Tesseract

G-washington 发表于 2019/11/26 16:49:37 2019/11/26

【摘要】今日鲲鹏论坛小助发了一篇云端体验帖子，迫不及待的我进行了一把ecs体验。分配的弹性云服务器规格：2vCPUs|4G|CentOS6.5 64bit首先登录上华为云官网，在控制台找到分配的弹性云服务器复制IP，打开桌面上的XFce，执行如下代码，将EIP修改为IP：LANG=en_us.UTF-8 ssh root@EIP输入密码，配置Tesseract环境所需要的依赖包，例如构建系统需要的A...

分配的弹性云服务器规格：2vCPUs|4G|CentOS6.5 64bit

首先登录上华为云官网，在控制台找到分配的弹性云服务器复制IP，打开桌面上的XFce，执行如下代码，将EIP修改为IP：

LANG=en_us.UTF-8 ssh root@EIP

输入密码，配置Tesseract环境所需要的依赖包，例如构建系统需要的Auto make，创建库的工具libtools、C++编译器、图片库等等

输入如下命令行进行相关依赖包安装：

yum install automake libtool gcc-c++ libjpeg-devel libpng-devel libtiff-devel -y

leptonica是tesserart的依赖库，使用它可以实现tesserart识别串的编译

下载leptonica安装包，执行如下命令行：

wget https://sandbox-experiment-resource.obs.cn-north-1.myhuaweicloud.com/kunpeng-tesseract/leptonica-1.78.0.tar.gz

解压安装包，输入以下命令行：

tar -xvf leptonica-1.78.0.tar.gz

编译安装，先进入leptonica文件夹输入命令行：

cd leptonica-1.78.0

./configure --prefix=/usr/ && make -j4 && make install

配置leptonica所需要的环境变量：

进入：vim etc\profile

进入文件后在键盘上按shift+G键，跳转到文档的底部，将光标移动到done下一行，输入i进入编写状态，将下面的代码输入进去

export PKG_CONFIG_PATH=/usr/lib/pkgconfig

之后按esc退出编辑状态，输入:wq退出文档，输入下面的命令行进行个保存运行。

source /etc/profile && ldconfig

配置tesseract

进入src文件，下载tesseract，输入如下命令行：

cd /usr/local/src
wget https://sandbox-experiment-resource.obs.cn-north-1.myhuaweicloud.com/kunpeng-tesseract/tesseract-4.0.0.tar.gz

解压压缩包：

tar -xvf tesseract-4.0.0.tar.gz

打开文件夹进行编译安装，输入如下命令行：

cd tesseract-4.0.0

./autogen.sh && ./configure && make -j4 && make install

编译成功后，进入root账户下，下载英文语言包：

cd /root
wget https://sandbox-experiment-resource.obs-website.cn-north-1.myhwclouds.com/kunpeng-tesseract/eng.traineddata

下载中文语言包：

wget https://sandbox-experiment-resource.obs-website.cn-north-1.myhwclouds.com/kunpeng-tesseract/chi_sim.traineddata

tesserart识别语音包需要将语音包放置到“usr/local/share/tessdata”这个目录下一般与tesserart识别：

cp eng.traineddata /usr/local/share/tessdata -r && cp chi_sim.traineddata /usr/local/share/tessdata -r

接下来让我们下载个鲲鹏文字图片来进行个测试吧：

wget https://portal-www-software.obs.cn-north-1.myhuaweicloud.com:443/kunpeng_chi.bmp

执行以下命令让我们来查看下测试结果：

tesseract -l chi_sim kunpeng_chi.bmp res_chi && cat res_chi.txt

接下来让我们测试下英文测试结果：

下载英文测试图片

wget https://portal-www-software.obs.cn-north-1.myhuaweicloud.com:443/kunpeng.bmp

执行如下命令行进行测试：

tesseract kunpeng.bmp result && cat result.txt

至此我们tesserart文字识别搭建完成！

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

#化鲲为鹏，我有话说#使用华为云鲲鹏弹性云服务器部署文字识别Tesseract

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

推荐阅读

相关产品