《卷积神经网络与计算机视觉》 —2.2.3加速健壮特征
2.2.3加速健壮特征
SURF[Bay et al.,2008]是SIFT的加速版。在SIFT中,高斯拉普拉斯算子用DoG近似,以构造尺度空间。SURF通过使用盒式滤波器估算LoG来加速此过程。因此,借助于积分图像可以容易地计算具有盒式滤波器的卷积,并且可以针对不同的尺度并行地执行。
1.关键点定位
在第一步中,基于Hessian矩阵的斑点检测器用于定位关键点。Hessian矩阵的行列式用于选择潜在关键点的位置和尺度。更确切地说,对于图像I上给定点p(x,y),H(p,σ)表示在关键点p处尺度为σ的Hessian矩阵,定义如下:
其中,Lxx(p,σ)是图像I在关键点p处的高斯二阶导数的卷积2x2g(σ),然而,SURF使用近似的高斯二阶导数而不是使用高斯滤波器,这可以使用积分图像以非常低的计算成本进行估计。因此,与SIFT不同,SURF不需要迭代地将相同的滤波器应用于先前滤波的层的输出,并且通过保持相同的图像并改变滤波器尺寸(如9×9、25×15、21×21和27×27)来完成尺度空间分析。
然后,将图像中每个点的3×3×3邻域中的非极大值抑制应用到图像中的关键点定位中。 然后使用Brown和Lowe在2002年提出的方法,在尺度和图像空间中对Hessian矩阵的行列式的最大值进行插值。
2.方位定向
为了实现旋转不变性,计算围绕关键点的半径为6s的圆形邻域内的水平x和垂直y方向上的Haar小波响应,其中s是检测关键点的标尺。然后,水平dx和垂直dy方向上的Haar小波响应用以关键点为中心的高斯加权,并表示为二维空间中的点。通过计算60度的滑动方向窗口内的所有响应的总和来估计关键点的主导定向。然后对窗口内的水平和垂直响应求和。两个求和的响应被认为是局部向量。所有窗口上的最长方向向量确定关键点的方向。为了在健壮性和角度分辨率之间取得平衡,需要仔细选择滑动窗口的尺寸。
3.关键点描述符
为了描述每个关键点p周围的区域,将p点周围的一个20s×20s的正方形区域提取出来,然后沿着p的方向定向。p周围的归一化取向区域被分成较小的4×4正方形子区域。对于每个子区域,在5×5的规则间隔的采样点处提取水平dx和垂直dy方向上的Haar小波响应。为了实现对变形、噪声和平移的更强的健壮性,Haar小波响应用高斯加权。然后,在每个子区域上对dx和dy求和,结果形成特征向量中的第一组条目。计算响应的绝对值之和,dx 和dy也计算出来,然后将其添加到特征向量以编码关于强度变化的信息。由于每个子区域具有4维特征向量,因此连接所有4×4子区域导致64维描述符。
- 点赞
- 收藏
- 关注作者
评论(0)