OCR(三)文字区域检测
【摘要】 介绍两种文字区域检测模型。
文本区域检测
文本区域检测的任务是将图片中出现的文本检测出来,而现实情况中这些文本可能是不同语言,不同大小,有不同角度的倾斜,或者存在不同程度的遮挡问题,同时,画面背景可能也十分复杂。解决这些问题成为文本区域检测的挑战,有很多基于不同原理的解决方法,下面我们将在案例中重点介绍如下三种文本区域检测模型:
CTPN
CTPN是自然场景中通过连接连续文字区域进行文字检测的方法,是一种经典的基于Proposal的文本检测方法。CTPN在2016年由Zhi Tian,Weilin Huang,Tong He等提出,在不固定文本长度的场景中有教好的表现。下图展示了CTPN的检测结果,其中黄色框为标注区域,红色框为预测区域。
图片来源自CTPN论文
EAST
EAST是一种结合了segmentation和Proposal的文本检测方法。在2017年,EAST文本检测方法出现,对比之前的文本检测方法,EAST简化成了两个阶段:FCN多通道的全连接层以及NMS非极大值抑制。简化的流程并没有对EAST的效果有很大影响,但是效率却大大却有所提升。下图展示了EAST的预测示例。
【版权声明】本文为华为云社区用户原创内容,未经允许不得转载,如需转载请自行联系原作者进行授权。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)