建议使用以下浏览器,以获得最佳体验。 IE 9.0+以上版本 Chrome 31+ 谷歌浏览器 Firefox 30+ 火狐浏览器
请选择 进入手机版 | 继续访问电脑版
设置昵称

在此一键设置昵称,即可参与社区互动!

确定
我再想想
选择版块
直达楼层
标签
您还可以添加5个标签
  • 没有搜索到和“关键字”相关的标签
  • 云产品
  • 解决方案
  • 技术领域
  • 通用技术
  • 平台功能
取消

采纳成功

您已采纳当前回复为最佳回复

bjxingch

发帖: 24粉丝: 1

发消息 + 关注

发表于2020年11月13日 17:13:34 152 5
直达本楼层的链接
楼主
显示全部楼层
[AI人工智能全栈成长计划] 【问答官3阶段】OCR文字识别流程是什么?

描述OCR文字识别流程

举报
分享

分享文章到朋友圈

分享文章到微博

采纳成功

您已采纳当前回复为最佳回复

hwJw19

发帖: 31粉丝: 7

发消息 + 关注

发表于2020年11月13日 17:14:33
直达本楼层的链接
沙发
显示全部楼层

(1)准备一张含有文字的原图;
(2)对原图进行文字位置的检测,检测结果可能是水平矩形框,也可能是倾斜矩形框;
(3)从原图中把文字框对应的图片切下来,并旋转正,得到水平的文字块切片图;
(4)对每个文字块切片图依次进行字符识别,每个切片图的识别结果汇总起来,就得到原图的文字识别结果。
因此完整的端到端OCR流程是:输入原图 -> 文字检测 ->文字块切片 -> 字符识别 -> 识别结果汇总。

图片.png

点赞 评论 引用 举报

采纳成功

您已采纳当前回复为最佳回复

Felix666

发帖: 51粉丝: 2

发消息 + 关注

发表于2020年11月13日 17:46:26
直达本楼层的链接
板凳
显示全部楼层

根据课程中的描述大致总结如下:

1,图片预处理:如去噪、图片增强等

2,文本检测:使用算法对图片中的文本位置、大小和角度进行检测,常用的算法有CTPN+CRNN、EAST、PixelLink等

3,文字分割(可以省):将整串文字分割成单个字符

4,文字识别:使用CRNN+CTC算法进行识别

点赞 评论 引用 举报

采纳成功

您已采纳当前回复为最佳回复

运气男孩

发帖: 364粉丝: 48

发消息 + 关注

发表于2020年11月19日 23:19:13
直达本楼层的链接
地板
显示全部楼层

步骤一:进入华为云控制台-EI企业智能-OCR识别界面

步骤二:接着点击页面上方图片局部识别功能。

步骤三:点击添加文件图片按钮,选择一张要识别的图片并打开。

步骤四:接着找到图片下方一排工具,点击框选工具在图片上框选出想要进行文字识别的范围,框选完松开鼠标就会自动去识别了。

识别结束后,识别出来的文字就在右边方框中显示出来了,点击右下角保存为TXT按钮就好了。

以上就是OCR文字识别软件的几个步骤。


点赞 评论 引用 举报

采纳成功

您已采纳当前回复为最佳回复

漫游寰宇外

发帖: 6粉丝: 0

发消息 + 关注

发表于2020年11月28日 17:07:50
直达本楼层的链接
5#
显示全部楼层

1、图像输入、预处理:
图像输入:对于不同的图像格式,有着不同的存储格式,不同的压缩方式。预处理:主要包括二值化,噪声去除,倾斜较正等
2、二值化:
对摄像头拍摄的图片,大多数是彩色的图像,彩色的图像所含信息量巨大,对于图片的内容,我们可以简单的分为前景与背景,为了让计算机更快的,更好的识别文字,我们需要先对彩色的图进行处理,使图片只前景信息与背景信息,可以简单的定义前景信息为黑色,背景信息为白色,这就是二值化图了。
3、噪声去除:
对于不同的文档,我们对燥声的定义可以不同,根据燥声的特征进行去燥,就叫做噪声去除
4、倾斜较正:
由于一般用户,在拍照文档时,都比较随意,因此拍照出来的图片不可避免的产生倾斜,这就需要文字识别软件进行较正。
5、版面分析:将文档图片分段落,分行的过程就叫做版面分析,由于实际文档的多样性,复杂性,因此,目前还没有一个固定的,最优的切割模型。
6、字符切割:
由于拍照条件的限制,经常造成字符粘连,断笔,因此极大限制了识别系统的性能,这就需要文字识别软件有字符切割功能。
7、字符识别:
这一研究,已经是很早的事情了,比较早有模板匹配,后来以特征提取为主,由于文字的位移,笔画的粗细,断笔,粘连,旋转等因素的影响,极大影响特征的提取的难度。
8、版面恢复:
人们希望识别后的文字,仍然像原文档图片那样排列着,段落不变,位置不变,顺序不变,的输出到word文档,pdf文档等,这一过程就叫做版面恢复。
9、后处理、校对:
根据特定的语言上下文的关系,对识别结果进行较正,就是后处理。


点赞 评论 引用 举报

采纳成功

您已采纳当前回复为最佳回复

yzx

发帖: 11粉丝: 3

发消息 + 关注

发表于2020年11月29日 20:23:48
直达本楼层的链接
6#
显示全部楼层

常规的OCR文字识别处理的过程包括:

1、图像输入、预处理:二值化图片、噪声去除、倾斜较正;

2、版面分析:把页面分为横排文本、竖排文本、表格、图片等不同区域,帮助字符切割、识别OCR;

3、设置语种:选择需要什么OCR语种的引擎程序;

4、输出结果:输出OCR识别结果为原版原样的优质文件;


点赞 评论 引用 举报

游客

富文本
Markdown
您需要登录后才可以回帖 登录 | 立即注册

结贴

您对问题的回复是否满意?
满意度
非常满意 满意 一般 不满意
我要反馈
0/200