《Python人脸识别:从入门到工程实践》 ——3.7 本章小结
3.7 本章小结
在本章中,我们接触到了计算机视觉的一些基本概念,并介绍了两种常用的颜色模型,分别是RGB颜色模型和HSV颜色模型。其中,RGB颜色模型的空间结构是立方体结构,而HSV颜色模型的空间结构是椎体结构。相比之下,我们更常用的颜色模型是RGB颜色模型,而HSV颜色模型中的很多概念对我们后续的学习还是非常有帮助的。
之后我们又介绍了图像的几种表现形式,分别是彩***像、灰度图像以及二值图像。通过前面的介绍,我们知道彩***片不是一个简单的二维矩阵就可以表示的,我们可以用两种形式来理解它的结构。一种是可以将其认为是一个二维矩阵的表现形式,但是这个二维矩阵的每一个元素不是一个具体的数值,而是由红、绿、蓝3种颜色组成的一个数组;或者我们以另一种方式来理解这个彩***像的结构,可以认为一张彩***片是由3张二维矩阵叠加而成的,这3张二维矩阵分别记录了各个像素点的红、绿、蓝颜色值。而相比之下,灰度图像就更容易理解了,我们可以将其简单地认为是一张二维矩阵。这样,二值图像就是在灰度图像的基础上进一步“简化”,其数值只包括对黑、白两种颜色的表示,是二值的,可以用0或1来表示。
在本章中,我们介绍了信号与噪声的概念,我们明确了信号是理解图像所要表达信息的真正来源,而噪声的出现只会减少我们在图片中获取到的信息。与此同时,噪声的出现会对图片的进一步处理造成干扰,因此,尽可能地过滤噪声是一项很有必要的操作。我们采用滤波方法可以减少噪声对图片的干扰,但是噪声并不能完全消除,只能尽可能地减少。
图片的几何变换是一项很有用的操作,我们可以使用线性代数中的叉乘运算来完成绝大多数功能。在一个向量空间进行一次线性变换再做一个平移,变换为另一个向量空间的过程称为仿射变换。将本章所学的图像变换形式综合到一起便构成了一个仿射变换。进行仿射变换的过程可以用线性代数的矩阵运算来表示:x
其中,s是缩放系数,θ是旋转角度,T代表位移向量,R是一个正交矩阵。
在本章的最后,我们学习了对图像进行特征描述的方法,也就是提取图片特征的算法,称为特征描述子。特征描述子相当于对图片进行降维处理,抛弃图片中我们不关心的部分,提取其主要成分,从而可以完成图像识别、图像分类等功能,是对图片进行处理的重要一环。当然,对图片进行特征提取的方法并不仅限于这几种,例如使用PCA算法也可以完成对图片的特征提取,使用深度学习的方法对图片进行特征提取,其特征值更是多种多样。
- 点赞
- 收藏
- 关注作者
评论(0)