一文带你看透通用文字识别 OCR

举报
yd_222433026 发表于 2023/03/07 15:17:37 2023/03/07
【摘要】 随着人工智能技术的不断发展,通用文字识别OCR 也变得越来越重要。通用文字识别OCR 是指对文本图像进行分析,以转换图像中的文本为可用的文本形式的过程,其主要用途是提供文本可搜索和复制的功能。

什么是 OCR?

OCR技术指的是 Optical Character Recognition 或光学文字识别技术,即从图像中识别文字,并将其转换为电子文本或机器可读格式。它可以被广泛应用于图像处理,文字处理,自然语言处理,计算机视觉和数据挖掘领域。
OCR技术通常包括三个步骤:图像预处理、字符识别和识别输出处理。图像预处理的目的是对原始图像进行改进,以便在后续步骤中获得更好的识别结果。识别输出处理主要是改善识别结果,以降低识别错误率,包括拼写检查,空格检查,格式更正等等。OCR技术已经被应用在许多地方,包括文件转录、图书出版、发票处理、社会安全号码自动识别等。它不仅可以有效地帮助各个行业处理大量文字信息,而且还可以提高工作效率。正是由于它的优势和重要性,OCR技术才被视为文字处理的一个主要方向,在计算机视觉和自然语言处理方面也发挥着越来越重要的作用。

通用文字识别OCR

随着人工智能技术的不断发展,通用文字识别OCR 也变得越来越重要。通用文字识别OCR 是指对文本图像进行分析,以转换图像中的文本为可用的文本形式的过程,其主要用途是提供文本可搜索和复制的功能。它具有识别准确率高,运行速度快,识别范围广的优势,可以精确识别出内容,为工作过程中提供了高效的帮助。

通用文字识别在多个行业及商业应用中得到了广泛应用,那么就少不了API的使用。APISpace通用文字识别OCR接口(https://www.apispace.com/eolink/api/ocrbase/introduction?utm_source=hwyun&utm_content=deep&utm_term=tongyongwenziocr),多场景、多语种、高精度的整图文字检测和识别服务,多项指标行业领先,可识别中、英、日、韩、法、德多种语言。识别结果包含文字在图片中的位置信息,方便进行版式的二次处理。传入要识别的图片即可返回图片中的文字识别结果。

接口使用示例

  • 识别的图片:
  • 识别结果:
{ "words_result": [{ "word": "蔷薇风细一帘香", "location": [ [354, 68], [394, 68], [394, 400], [354, 400] ] }, { "word": "春残何事苦思乡", "location": [ [579, 70], [620, 70], [620, 400], [579, 400] ] }, { "word": "梁燕语多终日在", "location": [ [429, 72], [468, 72], [468, 399], [429, 399] ] }, { "word": "病里梳头恨发长", "location": [ [505, 72], [544, 72], [544, 398], [505, 398] ] }, { "word": "春残", "location": [ [646, 69], [717, 69], [717, 220], [646, 220] ] }, { "word": "李清照", "location": [ [286, 306], [313, 306], [313, 394], [286, 394] ] }], "words_count": 6, "log_id": "d22a694e-bc96-11ed-9da0-00000000e0d8" }

应用场景

  • 拍照/截图识别
使用通用文字识别技术,实现拍照文字识别、相册图片文字识别和截图文字识别,可应用于搜索、书摘、笔记、翻译等移动应用中,方便用户进行文本的提取或录入,有效提升产品易用性和用户使用体验。
  • 内容审核与监管
自动提取图像中的文字内容,结合文本审核技术识别违规内容,提示相应风险,协助进行违规处理,可应用于电商广告审核、舆情监管等场景,帮助企业有效规避业务风险。
  • 视频内容分析
检测识别视频中的字幕、标题、弹幕等文字内容,并根据文字位置判断文字类型,可应用于视频分类和标签提取、视频内容审核、营销分析等场景,有效提升内容分类、检索的效率。
  • 纸质文档电子化
识别提取各类医疗单据、金融财税票据、法律卷宗等纸质文档中的文字信息,并可基于位置信息进行比对、结构化处理,提高信息录入、存档、检索的效率。


【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。