新手小白,带你体验华为云OCR【玩转华为云】
什么叫OCR
OCR(光学字符识别,Optical Character Recognition)是一种技术,指电子设备(如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。简单来说,OCR 技术就是通过光学方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工。
OCR的原理是什么
OCR 技术的实现过程可以分为以下几个步骤:
预处理:首先对输入的图像进行预处理,包括灰度化、二值化、噪声去除、倾斜矫正等操作。灰度化是将彩色图像转换为灰度图像,使图像仅包含亮度信息;二值化是将灰度图像转换为二值图像,即只有黑白两种亮度;噪声去除是消除图像中的杂乱信息,提高识别精度;倾斜矫正是为了纠正图像中字符的倾斜角度,使字符更好地与识别模板匹配。
特征提取:在预处理完成后,需要从图像中提取出字符的特征信息,如笔画、长度、宽度等。这些特征信息将用于与字符识别库中的字符模板进行匹配。
字符识别:将提取到的特征信息与字符识别库中的字符模板进行匹配,通过比较特征信息之间的相似度,确定图像中的字符是什么。这一步通常采用一些机器学习或深度学习方法,如支持向量机(SVM)、神经网络(NN)等。
后处理:对识别结果进行校对和修正,以提高识别准确性。这一步可能包括对识别结果的排版和格式调整,以便于输出或进一步编辑。
总之,OCR 技术通过检测图像中的暗、亮模式来确定字符的形状,然后利用字符识别方法将形状翻译成计算机文字。在识别过程中,需要进行预处理、特征提取、字符识别和后处理等操作,以提高识别的准确性和效果。
OCR在生产生活中的重要意义
OCR 技术在提高工作效率、实现自动化文档处理方面具有重要意义。例如,运用 OCR 技术可以将印刷体或手写字转换成电子文本,自动地将纸质文档转化为电子文档,从而节省人力和时间。此外,OCR 技术在金融、医疗、教育等领域也有广泛应用,如识别银行票据、病历、试卷等。随着人工智能技术的发展,OCR 在图像识别、自然语言处理等方面的应用也在不断拓展。
华为云OCR入口在哪
首先,打开华为云官网 https://www.huaweicloud.com/
然后,在产品选项卡中,找到人工智能,选择文字识别OCR,进入华为云OCR产品主页
OCR主页地址是:https://www.huaweicloud.com/product/generalocr.html
点击页面中的“Demo体验”按钮,开始进行OCR体验
实际体验华为云OCR
点击“Demo体验”按钮后,会来到OCR控制台
我们切换到“通用类”。要知道,能识别出电脑输出的标准字体并不算什么,厉害的OCR要能识别出人写的未知字体,才算真正能用的OCR
我们在网上随便搜一个“小学生语文作文”,然后找个稍微清晰的,如下图。我们将图片下载下来,然后送给OCR看看它能不能识别
现在网上的图片多为 jfif 格式,为了便于查找,我们将其重命名一下,然后点击保存按钮。
接着,切换到“通用类”—>“OCR通用文字”,然后点击“上传本地图片”按钮,上传我们刚刚下载的图片
可以看到,华为云提示并不支持jfif。上传文件仅支持JPEG、JPG、PNG格式
这样的话,我们只能右击,使用画图打开文件
然后将其另存为 PNG 图片
可以看到,识别大体都正确。但还是有些瑕疵的,希望改进
- 点赞
- 收藏
- 关注作者
评论(0)