OCR(三)文字区域检测

举报
开源小分舵-sun.57123 发表于 2019/08/22 16:48:11 2019/08/22
【摘要】 介绍两种文字区域检测模型。

文本区域检测


文本区域检测的任务是将图片中出现的文本检测出来,而现实情况中这些文本可能是不同语言,不同大小,有不同角度的倾斜,或者存在不同程度的遮挡问题,同时,画面背景可能也十分复杂。解决这些问题成为文本区域检测的挑战,有很多基于不同原理的解决方法,下面我们将在案例中重点介绍如下三种文本区域检测模型:

CTPN

CTPN是自然场景中通过连接连续文字区域进行文字检测的方法,是一种经典的基于Proposal的文本检测方法。CTPN在2016年由Zhi Tian,Weilin Huang,Tong He等提出,在不固定文本长度的场景中有教好的表现。下图展示了CTPN的检测结果,其中黄色框为标注区域,红色框为预测区域。

图片来源自CTPN论文

image.png


EAST

EAST是一种结合了segmentation和Proposal的文本检测方法。在2017年,EAST文本检测方法出现,对比之前的文本检测方法,EAST简化成了两个阶段:FCN多通道的全连接层以及NMS非极大值抑制。简化的流程并没有对EAST的效果有很大影响,但是效率却大大却有所提升。下图展示了EAST的预测示例。

image.png

【版权声明】本文为华为云社区用户原创内容,未经允许不得转载,如需转载请自行联系原作者进行授权。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。