【深入理解文字识别】从技术分析到论文解读,专家送上精品文章合集
【摘要】 计算机文字识别,俗称光学字符识别,英文全称是Optical Charater Recognition(简称OCR),它是利用光学技术和计算机技术把印刷在或者写在图纸上的文字以文本形式提取出来,并转换成一种计算机能够接受、人又可以理解的格式。本文汇总了文字识别技术综述与论文解读系列文章,一起深入学习文字识别相关技术。
文章目录 持续更新中
技术综述系列
传统OCR识别综述
技术综述二:标注数据不足下的深度学习方法概述
技术综述三:基于边界的目标检测方法简介
技术综述四:目标检测之RepPoints系列算法讲解
技术综述五:旋转目标检测系列算法讲解
技术综述六:文字识别中基于Transformer识别方法汇总简介
技术综述七:一文带你探讨场景文本识别中的语言模型
技术综述八:端到端通用目标检测方法介绍
技术综述九:自然场景图像的文字擦除算法介绍
技术综述十:文字识别之关键信息提取
技术综述十一:视频OCR基础知识、常见数据集和挑战
技术综述十二:图网络的基本概念
技术综述十三:弯曲文本检测算法(一)
技术综述十四:弯曲文本检测算法(二)
论文解读系列
论文解读系列一:CVPR 2019最新论文自然场景文本检测PSENet
论文解读系列二:AAAI 2020 oral最新文本行检测论文DBNet
论文解读系列三:CVPR 2019最新论文基于CornerNet改进的ExtremeNet
论文解读系列四:实时端到端场景文字检测识别网络ABCNet(CVPR 2020论文)
论文解读系列五:结合NLP的文本识别方法SEED (Semantics Enhanced Encoder-Decode)
论文解读系列六:图片文字擦除方法EnsNet: Ensconce Text in the Wild
论文解读系列七:信息提取论文解读
论文解读系列八:文字识别中基于Transformer识别方法之 HGA-STR 简介
论文解读系列九:文字识别中基于Transformer识别方法之 SRN 简介
论文解读系列十:空洞卷积框架搜索
论文解读系列十一:图神经网络应用于半结构化文档的命名实体识别和关系提取
论文解读系列十二:SDMG-R结构化提取——无限版式小票场景应用
论文解读系列十三:全局信息对于图网络文档解析的影响
论文解读系列十四:基于transformer的多目标跟踪方法TrackFormer详细解读
论文解读系列十五:文档结构分析
论文解读系列十六:Zero-Shot场景下的信息结构化提取
论文解读系列十七:基于Transformer的直线段检测
论文解读系列十八:融合视觉、语义、关系多模态信息的文档版面分析架构VSR
论文解读系列十九:用于目标检测的高斯检测框与ProbIoU
论文解读系列二十:自然场景文字检测与识别系列--再探DB文字检测算法
论文解读系列二十一:自然场景文字检测与识别系列--端到端文字识别算法Mask TextSpotter系列解读-上
论文解读系列二十二:自然场景文字检测与识别系列--端到端文字识别算法Mask TextSpotter系列解读-下
论文解读系列二十三:探索FET-GAN
论文解读系列二十四:用于细粒度分类的Transformer结构—TransFG
论文解读系列二十五:LayoutLM: 面向文档理解的文本与版面预训练
论文解读系列二十六:基于视觉匹配的自适应文本识别
论文解读系列二十七:文本行识别模型的再思考
论文解读二十八:表格识别模型TableMaster
论文解读系列二十九:无监督视觉表征学习的动量对比
论文解读系列三十:无参数的注意力模块SimAm论文解读
【声明】本内容来自华为云开发者社区博主,不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
热门文章
评论(0)