目标检测Anchor Box学习记录
【摘要】 预定义边框就是一组预设的边框,在训练时,以真实的边框位置相对于预设边框的偏移来构建训练样本。 这就相当于,预设边框先大致在可能的位置“框“出来目标,然后再在这些预设边框的基础上进行调整。为了尽可能的框出目标可能出现的位置,预定义边框通常由上千个甚至更多,通常使用各种形状的“滑动窗口”,在原图像滑动来产不同位置不同形状的预设边框,深度学习中可以使用Anchor Box在图像的不同位置生成边框,...
预定义边框就是一组预设的边框,在训练时,以真实的边框位置相对于预设边框的偏移来构建训练样本。 这就相当于,预设边框先大致在可能的位置“框“出来目标,然后再在这些预设边框的基础上进行调整。为了尽可能的框出目标可能出现的位置,预定义边框通常由上千个甚至更多,通常使用各种形状的“滑动窗口”,在原图像滑动来产不同位置不同形状的预设边框,深度学习中可以使用Anchor Box在图像的不同位置生成边框,并且能够方便的提取边框对应区域的特征,用于边框位置的回归。
一个Anchor Box可以由:边框的纵横比和边框的面积(尺度)来定义,相当于一系列预设边框的生成规则,根据Anchor Box,可以在图像的任意位置,生成一系列的边框。通常是以CNN提取到的Feature Map 的点为中心位置,所以不需要指定中心位置。
在一幅图像中,要检测的目标可能出现在图像的任意位置,并且目标可能是任意的大小和任意形状。
使用Anchor box的Scale来表示目标的大小;
使用Anchor box的Aspect Ratio来表示目标的形状;
使用CNN提取的Feature Map的点,来定位目标的位置;
使用Anchor box的strides来表示平移的步长。
【版权声明】本文为华为云社区用户原创内容,未经允许不得转载,如需转载请自行联系原作者进行授权。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)