- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

【数字识别】基于matlab BP神经网络不同字体0-9数字识别【含Matlab源码 1863期】

海神之光发表于 2022/06/08 00:05:39 2022/06/08

2.5k+ 0 0

【摘要】一、手写数字识别技术简介 1 案例背景手写体数字识别是图像识别学科下的一个分支，是图像处理和模式识别研究领域的重要应用之一，并且具有很强的通用性。由于手写体数字的随意性很大，如笔画粗细、字体大小、倾斜...

一、手写数字识别技术简介

1 案例背景
手写体数字识别是图像识别学科下的一个分支，是图像处理和模式识别研究领域的重要应用之一，并且具有很强的通用性。由于手写体数字的随意性很大，如笔画粗细、字体大小、倾斜角度等因素都有可能直接影响到字符的识别准确率，所以手写体数字识别是一个很有挑战性的课题。在过去的数十年中，研究者们提出了许多识别方法，并取得了一定的成果。手写体数字识别的实用性很强，在大规模数据统计如例行年检、人口普查、财务、税务、邮件分拣等应用领域都有广阔的应用前景"。
本案例讲述了图像中手写阿拉伯数字的识别过程，对手写数字识别的基于统计的方法进行了简要介绍和分析，并通过开发一个小型的手写体数字识别系统来进行实验。手写数字识别系统需要实现手写数字图像的读取功能、特征提取功能、数字的模板特征库的建立功能及识别功能。

2 BP算法与实现过程
2.1 BP算法基本原理
将已知输入向量和相应的输出向量(期望输出)作为训练样本，并假定即将学习的网络已被赋予一组权值。为消除梯度幅度的不利影响，利用弹性反向传播算法通过过如下步骤更新权值(图1)：首先，使用初始权值(不管正确与否)从输入层开始向前传播，计算出所有神经元的输出，这样输出层的输出与期望输出(即输出值与目标值)之间存在较大的误差。然后，计算作为神经元权值函数的]误差函数(损失函数或目标函数、代价函数)的梯度，根据误差降低最快的方向来调整更新权值，通过将输出误差反向传播给隐含层来不断调整误差函数。在计算误差梯度的同时，使用与上面同样的方法更新隐含层的权值。反复迭代更新，直到损失函数达到预定的理想目标。在弹性反向传播算法的学习过程中，权值的修正值即为学习率，而梯度只影影响权值变化的方向，即正负。

图1 反向传播神经网络模型

1.2 感知器神经网络
感知器(multilayer perceptron， MLP) 神经网络是模式识别的简单二元分类人工网络，它通过权值模仿神经细胞的突触，用激活函数模仿细胞体，偏置即为阈值。单层的感知器网络结构如图2所示。单层感知器可将外部输入x分成两类：当感知器的输出y为正数或零时，输入属于第一类；当感知器的输出为负数时，输入属于第二类。

1.3 实现过程
(1)图像读取
在本文中，设计并自建了样本的数据库，库中有0~9共10个阿拉伯数字的5000张不同的手写数字图像，均为白底黑色的bmp格式的文件，每个数字对应500张图片。实验要从每一个数字中都随机选取450张手写图像作为训练样本，每一个数字剩下的50张作为测试样本。部分数字样张如图3所示。

图3 数字样张
(2)提取特征
本设计中的训练样本数量多，而而一般神经网络输入层的神经元数就是训练样本向量的维数，因此需要对训练样本向量做降维预处理。预处理过程就是通过灰度阈值函数将图像转换成二值图像。降维前需先将所有图像做一次缩放，以确保每个图像的输入向量都具有相同的像素。本设计选定图像缩放的高度和宽度分别为70像素点和50像素点，符合一般手写阿拉伯数字的高宽比。对这些缩放后的图像作纵横切割，如图4所示，每10×10个像素点作为一系列像素块，构成一张包含35个像素块的二值图像计算每一个像素块中0和1的占比，并用它作为模式的一个特征值，这样可以构成5x7的特征值矩阵。考虑到感知器神申经网络输入向量只能是一维，故需要将此矩阵转换成一维向量作为训练样本的输入，转置后共生成35个一维向量。

图4 缩放后的图像切割

(3)构造标签
无论是训练样本还是测试样本，都需要构造标签，前者用于映射的学习，后者用于判断训练网络的正确率。一般地，输出层神经元个数即为分类网络中的分类类别数。阿拉伯数字是10类，故输出神经元数为10。每个类由具体的500个图像构成，包含训练样本和测试样本。通过提取特征每个类均生成35个一维向量：用500个列向量(1000000000)T来标注模式1，即数字1；(0100000000)标注模式2，即数字2；(0010000000)标注模式3，即数字3；依此类推，最后的(0000000001)标注模式0，即数字0。运行代码如下：

(4)随机选定训练样本和测试样本测试
利用MATLAB中已有的rand()伪随机数生成函数来生成5000个介于0和1之间的伪随机数。将生成的伪随机数做升序排序，通过索引来记录随机数原来的位置，并将原来的位置组合成新的行向量。在本设计中，输入层的神经元有35个，输出层神经元有10个，选取25为中间隐含层神经元个数。

(5)数字识别与正确率的计算
对比测试前的标签和仿真后的输出，用测试前的标签值减去输出值，得到误差值，将误差为0的视为正确识别，求出神经网络的正确率。具体运行代码如下：

二、部分源代码

三、运行结果

四、matlab版本及参考文献

1 matlab版本
2014a

2 参考文献
[1] 蔡利梅.MATLAB图像处理——理论、算法与实例分析[M].清华大学出版社，2020.
[2]杨丹,赵海滨,龙哲.MATLAB图像处理实例详解[M].清华大学出版社，2013.
[3]周品.MATLAB图像处理与图形用户界面设计[M].清华大学出版社，2013.
[4]刘成龙.精通MATLAB图像处理[M].清华大学出版社，2015.

3 备注
简介此部分摘自互联网，仅供参考，若侵权，联系删除

文章来源: qq912100926.blog.csdn.net，作者：海神之光，版权归原作者所有，如需转载，请联系作者。

原文链接：qq912100926.blog.csdn.net/article/details/125153895

点赞
收藏
关注作者

作者其他文章

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

开发者空间

了解空间

工作台

开发平台

实战案例

空间活动

空间论坛

开发平台

软件开发生产线 CodeArts

AI平台ModelArts

数据治理中心 DataArts Studio

数字内容生产线 MetaStudio

精选服务

云数据库 GaussDB

云数据库 RDS for MySQL

MapReduce服务 MRS

数据仓库服务 DWS

分布式缓存服务Redis版

分布式消息服务 DMS

华为云实时音视频 SparkRTC

媒体处理 MPC

主机迁移服务 SMS

对象存储迁移服务 OMS

云消息服务 KooMessage

云手机服务 KooPhone

企业搜索服务 KooSearch

云地图服务 KooMap

更多开放能力

开发工具

API生态

CodeArts API

API Explorer

Terraform Explorer

KooCLI

API 中心

SDK 中心

开发服务

Codelabs

DevStar

低代码平台Astro

CodeArts IDE

Huawei Cloud Toolkit

Classroom

开发资源

开源镜像站

开源资源

开发语言

开发实践

入门精选

分发资源

企业应用中心

企业通用专区

教育专区

华为应用专区

政务云专区

硬件云服务商城

医疗健康专区

跳蚤市场

华为云开发者日

直播专区

开发者精品活动

DTSE Tech Talk

加入HCDE

加入HCDG

加入HCSD

加入HCWD

鲁班会

沃土云创计划·企业

沃土云创计划·高校

沃土云创计划·个人

沃土云创计划·开源共创

博客

论坛

专题

开发者榜单

学习路径

在线课程

动手实验

考试认证

培训服务