《卷积神经网络与计算机视觉》 —2.2.3加速健壮特征

华章计算机 发表于 2020/02/14 16:06:08 2020/02/14
【摘要】 本节书摘来自华章计算机《卷积神经网络与计算机视觉》 一书中第2章,第2.2.3节,作者是[澳]萨尔曼·汗(Salman Khan)侯赛因·拉哈马尼(Hossein Rahmani)赛义德·阿法克·阿里·沙(Syed Afaq Ali Shah)穆罕默德·本纳努恩(Mohammed Bennamoun),黄智濒 戴志涛 译。

2.2.3加速健壮特征

SURF[Bay et al.,2008]是SIFT的加速版。在SIFT中,高斯拉普拉斯算子用DoG近似,以构造尺度空间。SURF通过使用盒式滤波器估算LoG来加速此过程。因此,借助于积分图像可以容易地计算具有盒式滤波器的卷积,并且可以针对不同的尺度并行地执行。

1.关键点定位

在第一步中,基于Hessian矩阵的斑点检测器用于定位关键点。Hessian矩阵的行列式用于选择潜在关键点的位置和尺度。更确切地说,对于图像I上给定点p(x,y),H(p,σ)表示在关键点p处尺度为σ的Hessian矩阵,定义如下:

 

image.png

 

其中,Lxx(p,σ)是图像I在关键点p处的高斯二阶导数的卷积2x2g(σ),然而,SURF使用近似的高斯二阶导数而不是使用高斯滤波器,这可以使用积分图像以非常低的计算成本进行估计。因此,与SIFT不同,SURF不需要迭代地将相同的滤波器应用于先前滤波的层的输出,并且通过保持相同的图像并改变滤波器尺寸(如9×9、25×15、21×21和27×27)来完成尺度空间分析。

然后,将图像中每个点的3×3×3邻域中的非极大值抑制应用到图像中的关键点定位中。 然后使用Brown和Lowe在2002年提出的方法,在尺度和图像空间中对Hessian矩阵的行列式的最大值进行插值。

2.方位定向

为了实现旋转不变性,计算围绕关键点的半径为6s的圆形邻域内的水平x和垂直y方向上的Haar小波响应,其中s是检测关键点的标尺。然后,水平dx和垂直dy方向上的Haar小波响应用以关键点为中心的高斯加权,并表示为二维空间中的点。通过计算60度的滑动方向窗口内的所有响应的总和来估计关键点的主导定向。然后对窗口内的水平和垂直响应求和。两个求和的响应被认为是局部向量。所有窗口上的最长方向向量确定关键点的方向。为了在健壮性和角度分辨率之间取得平衡,需要仔细选择滑动窗口的尺寸。

3.关键点描述符

为了描述每个关键点p周围的区域,将p点周围的一个20s×20s的正方形区域提取出来,然后沿着p的方向定向。p周围的归一化取向区域被分成较小的4×4正方形子区域。对于每个子区域,在5×5的规则间隔的采样点处提取水平dx和垂直dy方向上的Haar小波响应。为了实现对变形、噪声和平移的更强的健壮性,Haar小波响应用高斯加权。然后,在每个子区域上对dx和dy求和,结果形成特征向量中的第一组条目。计算响应的绝对值之和,dx 和dy也计算出来,然后将其添加到特征向量以编码关于强度变化的信息。由于每个子区域具有4维特征向量,因此连接所有4×4子区域导致64维描述符。


【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件至:cloudbbs@huaweicloud.com进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容。
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。