- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

【印刷数字识别】基于matlab OCR识别系统【含Matlab源码 438期】

海神之光发表于 2022/05/29 05:14:48 2022/05/29

【摘要】一、OCR简介 1 什么是OCR技术？ OCR英文全称是Optical Character Recognition，中文叫做光学字符识别。它是利用光学技术和计算机技术把印在或写在纸上的文字读取出来，并转...

一、OCR简介

1 什么是OCR技术？
OCR英文全称是Optical Character Recognition，中文叫做光学字符识别。它是利用光学技术和计算机技术把印在或写在纸上的文字读取出来，并转换成一种计算机能够接受、人又可以理解的格式。文字识别是计算机视觉研究领域的分支之一，而且这个课题已经是比较成熟了，并且在商业中已经有很多落地项目了。

2 OCR技术的分类：
2.1 按主题划分：手写体识别和印刷体识别。

(1)印刷体大多都是规则的字体，技术上的难点是，在印刷过程中字体很可能变得断裂或者墨水粘连，使得OCR识别异常困难。当然这些都可以通过一些图像处理的技术帮他尽可能的还原，进而提高识别率。总的来说，单纯的印刷体识别在业界已经能做到很不错了，但说100%识别是肯定不可能的，但是说识别得不错那是没毛病。

(2)手写体识别一直是OCR界一直想攻克的难关，但是时至今天，识别难度还是很大。为什么手写体识别这么难识别？因为人类手写的字往往带有个人特色，每个人写字的风格基本不一样，虽然人类可以读懂你写的文字，但是机器缺很难。印刷体一般都比较规则，字体都基本就那几十种，机器学习这几十种字体并不是一件难事，但是手写体，每个人都有一种字体的话，那机器该学习多少字体啊？这就是难度所在。

2.2 按识别的内容来分类
对于我们国人来说主要分成三类：汉字、英文字母、阿拉伯数字。识别数字是最简单了，毕竟要识别的字符只有0~9，而英文字母识别要识别的字符有26个（如果算上大小写的话那就52个），而中文识别，要识别的字符高达数千个因为汉字的字形各不相同，结构非常复杂（比如带偏旁的汉字）如果要将这些字符都比较准确地识别出来，是一件相当具有挑战性的事情。但是，并不是所有应用都需要识别如此庞大的汉字集，比如车牌识别，我们的识别目标仅仅是数十个中国各省和直辖市的简称，难度就大大减少了。当然，在一些文档自动识别的应用是需要识别整个汉字集的，所以要保证识别的整体的识别还是很困难的。

2.3 OCR流程

判断页面上的文本朝向，因为我们得到的这页文档往往都不是很完美的，很可能带有倾斜或者污渍，那么我们要做的第一件事就是进行图像预处理，做角度矫正和去噪。
对文档版面进行分析，进每一行进行行分割，把每一行的文字切割下来，最后再对每一行文本进行列分割，切割出每个字符，将该字符送入训练好的OCR识别模型进行字符识别，得到结果。
对其进行识别结果的矫正和优化，比如我们可以设计一个语法检测器，去检测字符的组合逻辑是否合理。比如，考虑单词Because，我们设计的识别模型把它识别为8ecause，那么我们就可以用语法检测器去纠正这种拼写错误，并用B代替8并完成识别矫正。这样子，

整个OCR流程就走完了。从大的模块总结而言，一套OCR流程可以分为：
版面分析 -> 预处理-> 行列切割 -> 字符识别 -> 后处理识别矫正
从上面的流程图可以看出，要做字符识别并不是单纯一个OCR模块就能实现的（如果单纯的OCR模块，识别率相当低），都要各个模块的组合来保证较高的识别率。

二、部分源代码

clc
clear all
close all
Symbols =['0' '1' '2' '3' '4' '5' '6' '7' '8' '9' '-'];
P3 = [];
Result = [];
path = 'C:\Users\lenovo\Desktop\23149049ocr\';          % working Path
ext = '_bold.bmp';                  %Train Data Files Extension name
P = zeros(16,12,11);

% Read 0-9 digits data
for i = 0: 9
    file = [path,char(48 + i) , ext];      % char(48) => '0'
   
    P(:,:,i + 1) = imread(file);
    P3 = [P3,P(:,:,i + 1)'];
end
  %  imshow(P(:,:,1));

  i = i + 1;
% read other symbols
    file = [path,'dash' , ext];
   
    P(:,:,i + 1) = imread(file);
    P3 = [P3,P(:,:,i + 1)'];
 
% figure
%  for i = 1:11
%       subplot( 11, 1, i );
%       imshow( P(:,:,i) );
%   end

P1 = reshape(P3, 12 * 16, 11);

T = zeros(11,11);
for i = 1:11
    T(i,i) = 1;
end

[R,Q] = size(P1);
[S2,Q] = size(T);

S1 =   25;

net = newff(minmax(P1),[S1 S1 S2],{'logsig' 'logsig','logsig'},'traingdx');

net.performFcn = 'sse';
net.trainParam.goal = 0.05;
net.trainParam.show = 100;
net.trainParam.epochs = 5000;
net.trainParam.mc = 0.95;

[net,tr] = train(net,P1,T);


sept2 = []; %character segment start-end pos
Test1 =[];
file = [path,'test_bold2.bmp'];
a = imread(file);
figure;
subplot(3,24,1:24);
imshow(a);

j =1;
  seg1 = a;
  b = sum(seg1) ; % character segment, if the vertical projection is zero, means the space between characters.
  b(find(b < 1) ) = 0;
  c = find(b == 0);
  d= find(b > 0);
  e = find(c > d(1));
  sept2 = [];
  for k = 1:size(e,2) -1    % delete repeated zero position
    if( c(e(k + 1)) - c(e(k)) > 1) 
        sept2 = [sept2, c(e( k ))];
        sept2 = [sept2, c(e(k + 1))];
    end    
  end
  

 %figure
  sept2 = [1, sept2];
 chCount = size(sept2);

 for k = 1: chCount(2) -1
     Test1 = [];
    tmp = zeros(16,1);
     z =   a(:,sept2(k)+1: sept2( k+1 ));
    t1 = size(z);
    if(t1(2)> 2) 
        tt1 = size(z);
%         if( tt1(2) < 11)
%             z = [z,tmp];
%         end
        tt1 = size(z);
%         if( tt1(2) < 11)
%            z = [tmp,z,tmp];
%         end
        z2 = imresize(z,[16,12],'bilinear');
%         z2 = ~z2;
%         z2 = ~z2;
%         z2 = double(z2);
%         z2 = imnoise(z2,'salt & pepper', 0.4);
        z2 = ~z2;
        z2 = ~z2;
        subplot(3,24,24+k);
        imshow(z2);
        z2 =z2';
        
        z3 = reshape(z2,16 * 12,1);
        Test1 = [Test1,z3];
        %figure;
        %imshow(z2);
        %title('TRUE');
 %   end

  
 
  1
  2
  3
  4
  5
  6
  7
  8
  9
  10
  11
  12
  13
  14
  15
  16
  17
  18
  19
  20
  21
  22
  23
  24
  25
  26
  27
  28
  29
  30
  31
  32
  33
  34
  35
  36
  37
  38
  39
  40
  41
  42
  43
  44
  45
  46
  47
  48
  49
  50
  51
  52
  53
  54
  55
  56
  57
  58
  59
  60
  61
  62
  63
  64
  65
  66
  67
  68
  69
  70
  71
  72
  73
  74
  75
  76
  77
  78
  79
  80
  81
  82
  83
  84
  85
  86
  87
  88
  89
  90
  91
  92
  93
  94
  95
  96
  97
  98
  99
  100
  101
  102
  103
  104
  105
  106
  107
  108
  109
  110
  111
  112
  113
  114

三、运行结果

四、matlab版本及参考文献

1 matlab版本
2014a

2 参考文献
[1] 蔡利梅.MATLAB图像处理——理论、算法与实例分析[M].清华大学出版社，2020.
[2]杨丹,赵海滨,龙哲.MATLAB图像处理实例详解[M].清华大学出版社，2013.
[3]周品.MATLAB图像处理与图形用户界面设计[M].清华大学出版社，2013.
[4]刘成龙.精通MATLAB图像处理[M].清华大学出版社，2015.

文章来源: qq912100926.blog.csdn.net，作者：海神之光，版权归原作者所有，如需转载，请联系作者。

原文链接：qq912100926.blog.csdn.net/article/details/114336403

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

【印刷数字识别】基于matlab OCR识别系统【含Matlab源码 438期】

一、OCR简介

二、部分源代码

三、运行结果

四、matlab版本及参考文献

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

【印刷数字识别】基于matlab OCR识别系统【含Matlab源码 438期】

一、OCR简介

二、部分源代码

三、运行结果

四、matlab版本及参考文献

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品