《Python人脸识别:从入门到工程实践》 ——3.7 本章小结

举报
华章计算机 发表于 2020/02/20 18:58:18 2020/02/20
【摘要】 本节书摘来自华章计算机《Python人脸识别:从入门到工程实践》 —— 书中第3章,第3.7节,作者是王天庆 。

3.7 本章小结

在本章中,我们接触到了计算机视觉的一些基本概念,并介绍了两种常用的颜色模型,分别是RGB颜色模型和HSV颜色模型。其中,RGB颜色模型的空间结构是立方体结构,而HSV颜色模型的空间结构是椎体结构。相比之下,我们更常用的颜色模型是RGB颜色模型,而HSV颜色模型中的很多概念对我们后续的学习还是非常有帮助的。

之后我们又介绍了图像的几种表现形式,分别是彩***像、灰度图像以及二值图像。通过前面的介绍,我们知道彩***片不是一个简单的二维矩阵就可以表示的,我们可以用两种形式来理解它的结构。一种是可以将其认为是一个二维矩阵的表现形式,但是这个二维矩阵的每一个元素不是一个具体的数值,而是由红、绿、蓝3种颜色组成的一个数组;或者我们以另一种方式来理解这个彩***像的结构,可以认为一张彩***片是由3张二维矩阵叠加而成的,这3张二维矩阵分别记录了各个像素点的红、绿、蓝颜色值。而相比之下,灰度图像就更容易理解了,我们可以将其简单地认为是一张二维矩阵。这样,二值图像就是在灰度图像的基础上进一步“简化”,其数值只包括对黑、白两种颜色的表示,是二值的,可以用0或1来表示。

在本章中,我们介绍了信号与噪声的概念,我们明确了信号是理解图像所要表达信息的真正来源,而噪声的出现只会减少我们在图片中获取到的信息。与此同时,噪声的出现会对图片的进一步处理造成干扰,因此,尽可能地过滤噪声是一项很有必要的操作。我们采用滤波方法可以减少噪声对图片的干扰,但是噪声并不能完全消除,只能尽可能地减少。

图片的几何变换是一项很有用的操作,我们可以使用线性代数中的叉乘运算来完成绝大多数功能。在一个向量空间进行一次线性变换再做一个平移,变换为另一个向量空间的过程称为仿射变换。将本章所学的图像变换形式综合到一起便构成了一个仿射变换。进行仿射变换的过程可以用线性代数的矩阵运算来表示:x

image.png

其中,s是缩放系数,θ是旋转角度,T代表位移向量,R是一个正交矩阵。

在本章的最后,我们学习了对图像进行特征描述的方法,也就是提取图片特征的算法,称为特征描述子。特征描述子相当于对图片进行降维处理,抛弃图片中我们不关心的部分,提取其主要成分,从而可以完成图像识别、图像分类等功能,是对图片进行处理的重要一环。当然,对图片进行特征提取的方法并不仅限于这几种,例如使用PCA算法也可以完成对图片的特征提取,使用深度学习的方法对图片进行特征提取,其特征值更是多种多样。


【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。