- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

《Python人脸识别：从入门到工程实践》 ——3.7　本章小结

华章计算机发表于 2020/02/20 18:58:18 2020/02/20

【摘要】本节书摘来自华章计算机《Python人脸识别：从入门到工程实践》 —— 书中第3章，第3.7节，作者是王天庆。

3.7　本章小结

在本章中，我们接触到了计算机视觉的一些基本概念，并介绍了两种常用的颜色模型，分别是RGB颜色模型和HSV颜色模型。其中，RGB颜色模型的空间结构是立方体结构，而HSV颜色模型的空间结构是椎体结构。相比之下，我们更常用的颜色模型是RGB颜色模型，而HSV颜色模型中的很多概念对我们后续的学习还是非常有帮助的。

之后我们又介绍了图像的几种表现形式，分别是彩***像、灰度图像以及二值图像。通过前面的介绍，我们知道彩***片不是一个简单的二维矩阵就可以表示的，我们可以用两种形式来理解它的结构。一种是可以将其认为是一个二维矩阵的表现形式，但是这个二维矩阵的每一个元素不是一个具体的数值，而是由红、绿、蓝3种颜色组成的一个数组；或者我们以另一种方式来理解这个彩***像的结构，可以认为一张彩***片是由3张二维矩阵叠加而成的，这3张二维矩阵分别记录了各个像素点的红、绿、蓝颜色值。而相比之下，灰度图像就更容易理解了，我们可以将其简单地认为是一张二维矩阵。这样，二值图像就是在灰度图像的基础上进一步“简化”，其数值只包括对黑、白两种颜色的表示，是二值的，可以用0或1来表示。

在本章中，我们介绍了信号与噪声的概念，我们明确了信号是理解图像所要表达信息的真正来源，而噪声的出现只会减少我们在图片中获取到的信息。与此同时，噪声的出现会对图片的进一步处理造成干扰，因此，尽可能地过滤噪声是一项很有必要的操作。我们采用滤波方法可以减少噪声对图片的干扰，但是噪声并不能完全消除，只能尽可能地减少。

图片的几何变换是一项很有用的操作，我们可以使用线性代数中的叉乘运算来完成绝大多数功能。在一个向量空间进行一次线性变换再做一个平移，变换为另一个向量空间的过程称为仿射变换。将本章所学的图像变换形式综合到一起便构成了一个仿射变换。进行仿射变换的过程可以用线性代数的矩阵运算来表示：x

其中，s是缩放系数，θ是旋转角度，T代表位移向量，R是一个正交矩阵。

在本章的最后，我们学习了对图像进行特征描述的方法，也就是提取图片特征的算法，称为特征描述子。特征描述子相当于对图片进行降维处理，抛弃图片中我们不关心的部分，提取其主要成分，从而可以完成图像识别、图像分类等功能，是对图片进行处理的重要一环。当然，对图片进行特征提取的方法并不仅限于这几种，例如使用PCA算法也可以完成对图片的特征提取，使用深度学习的方法对图片进行特征提取，其特征值更是多种多样。

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

《Python人脸识别：从入门到工程实践》 ——3.7　本章小结

3.7　本章小结

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

《Python人脸识别：从入门到工程实践》 ——3.7 本章小结

3.7 本章小结

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品

《Python人脸识别：从入门到工程实践》 ——3.7　本章小结

3.7　本章小结