《Python人脸识别:从入门到工程实践》 ——3.5 图像的几何变换

举报
华章计算机 发表于 2020/02/20 18:27:13 2020/02/20
【摘要】 本节书摘来自华章计算机《Python人脸识别:从入门到工程实践》 —— 书中第3章,第3.5.1节,作者是王天庆 。

3.5 图像的几何变换

图像的几何变换就是指在不改变图像原有内容的基础上,将图像的像素空间位置进行改变,以达到变换图像中像素点位置的目的。图像的几何变换一般包括图像空间变换和插值运算,常见的变换运算包括平移、旋转、缩放等。

3.5.1 平移

图像的平移比较容易理解,这与我们在实际生活中将物体搬移是一个道理。我们可以想象,图像是由若干个像素点组成的,对于彩***像来说,这个像素点是包含了RGB 3种颜色的;对于灰度图像来说,就是一个简单的矩阵,这个矩阵中某一个元素的数值就是图像中该像素点的灰度值。我们演示一下图像平移的过程,如图3-9所示。

image.png

图3-9 图像平移过程演示

图3-9演示的是某一个4行4列共计16个像素点的灰度图像向右下角平移一个单位之后的过程。我们可以看到,图3-9a中是一个完整的字母Z的图形,在向右下角平移一个单位的时候,由于图像尺寸的限制,在图3-9b中位于阴影区域外部的像素点必然会被丢弃。在图3-9c中,我们使用灰度值为0的像素点来填补空白部分,这个过程就是图像的平移过程。

我们可以看到,在图像进行平移的过程中,必然会造成某些像素点的丢失,同时,也会导致图像中产生空白区域,空白区域我们可以自己指定像素进行填充。当然,我们也可以选择先扩展图像的画布,然后再进行平移,这样只会引入一些空白部分,而不会导致像素点的丢失。我们通过图3-10来展示对图像进行平移后的效果。

我们可以看到,对图像进行平移操作其实就是对图像中的各个像素点进行平移操作,或者说对其坐标轴进行移动。我们用下面的式子来表述这个数学过程:image.png   

image.png

图3-10 图像平移效果

将其用矩阵的形式来表示,就可以表示为:

image.png

可以看到,这个过程是一个非常简单的线性变换过程,只需进行矩阵的加法运算即可。


【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。