新手小白,带你体验华为云OCR【玩转华为云】

举报
林欣 发表于 2023/08/31 22:30:18 2023/08/31
【摘要】 什么叫OCROCR(光学字符识别,Optical Character Recognition)是一种技术,指电子设备(如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。简单来说,OCR 技术就是通过光学方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加...

什么叫OCR

OCR(光学字符识别,Optical Character Recognition)是一种技术,指电子设备(如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。简单来说,OCR 技术就是通过光学方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工。

OCR的原理是什么

OCR 技术的实现过程可以分为以下几个步骤:

  1. 预处理:首先对输入的图像进行预处理,包括灰度化、二值化、噪声去除、倾斜矫正等操作。灰度化是将彩色图像转换为灰度图像,使图像仅包含亮度信息;二值化是将灰度图像转换为二值图像,即只有黑白两种亮度;噪声去除是消除图像中的杂乱信息,提高识别精度;倾斜矫正是为了纠正图像中字符的倾斜角度,使字符更好地与识别模板匹配。

  2. 特征提取:在预处理完成后,需要从图像中提取出字符的特征信息,如笔画、长度、宽度等。这些特征信息将用于与字符识别库中的字符模板进行匹配。

  3. 字符识别:将提取到的特征信息与字符识别库中的字符模板进行匹配,通过比较特征信息之间的相似度,确定图像中的字符是什么。这一步通常采用一些机器学习或深度学习方法,如支持向量机(SVM)、神经网络(NN)等。

  4. 后处理:对识别结果进行校对和修正,以提高识别准确性。这一步可能包括对识别结果的排版和格式调整,以便于输出或进一步编辑。

总之,OCR 技术通过检测图像中的暗、亮模式来确定字符的形状,然后利用字符识别方法将形状翻译成计算机文字。在识别过程中,需要进行预处理、特征提取、字符识别和后处理等操作,以提高识别的准确性和效果。

OCR在生产生活中的重要意义

OCR 技术在提高工作效率、实现自动化文档处理方面具有重要意义。例如,运用 OCR 技术可以将印刷体或手写字转换成电子文本,自动地将纸质文档转化为电子文档,从而节省人力和时间。此外,OCR 技术在金融、医疗、教育等领域也有广泛应用,如识别银行票据、病历、试卷等。随着人工智能技术的发展,OCR 在图像识别、自然语言处理等方面的应用也在不断拓展。

华为云OCR入口在哪

首先,打开华为云官网 https://www.huaweicloud.com/

然后,在产品选项卡中,找到人工智能,选择文字识别OCR,进入华为云OCR产品主页

image.png

OCR主页地址是:https://www.huaweicloud.com/product/generalocr.html

image.png

点击页面中的“Demo体验”按钮,开始进行OCR体验

实际体验华为云OCR

点击“Demo体验”按钮后,会来到OCR控制台

image.png

我们切换到“通用类”。要知道,能识别出电脑输出的标准字体并不算什么,厉害的OCR要能识别出人写的未知字体,才算真正能用的OCR

我们在网上随便搜一个“小学生语文作文”,然后找个稍微清晰的,如下图。我们将图片下载下来,然后送给OCR看看它能不能识别

image.png

现在网上的图片多为 jfif 格式,为了便于查找,我们将其重命名一下,然后点击保存按钮。

image.png

接着,切换到“通用类”—>“OCR通用文字”,然后点击“上传本地图片”按钮,上传我们刚刚下载的图片

image.png

可以看到,华为云提示并不支持jfif。上传文件仅支持JPEG、JPG、PNG格式

image.png

这样的话,我们只能右击,使用画图打开文件

image.png

然后将其另存为 PNG 图片

image.png

可以看到,识别大体都正确。但还是有些瑕疵的,希望改进

image.png

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。