目标检测Anchor Box学习记录

举报
离璞 发表于 2022/05/02 10:48:32 2022/05/02
【摘要】 预定义边框就是一组预设的边框,在训练时,以真实的边框位置相对于预设边框的偏移来构建训练样本。 这就相当于,预设边框先大致在可能的位置“框“出来目标,然后再在这些预设边框的基础上进行调整。为了尽可能的框出目标可能出现的位置,预定义边框通常由上千个甚至更多,通常使用各种形状的“滑动窗口”,在原图像滑动来产不同位置不同形状的预设边框,深度学习中可以使用Anchor Box在图像的不同位置生成边框,...

预定义边框就是一组预设的边框,在训练时,以真实的边框位置相对于预设边框的偏移来构建训练样本。 这就相当于,预设边框先大致在可能的位置“框“出来目标,然后再在这些预设边框的基础上进行调整。为了尽可能的框出目标可能出现的位置,预定义边框通常由上千个甚至更多,通常使用各种形状的“滑动窗口”,在原图像滑动来产不同位置不同形状的预设边框,深度学习中可以使用Anchor Box在图像的不同位置生成边框,并且能够方便的提取边框对应区域的特征,用于边框位置的回归。

一个Anchor Box可以由:边框的纵横比和边框的面积(尺度)来定义,相当于一系列预设边框的生成规则,根据Anchor Box,可以在图像的任意位置,生成一系列的边框。通常是以CNN提取到的Feature Map 的点为中心位置,所以不需要指定中心位置。

在一幅图像中,要检测的目标可能出现在图像的任意位置,并且目标可能是任意的大小和任意形状。

使用Anchor box的Scale来表示目标的大小;

使用Anchor box的Aspect Ratio来表示目标的形状;

使用CNN提取的Feature Map的点,来定位目标的位置;

使用Anchor box的strides来表示平移的步长。

【版权声明】本文为华为云社区用户原创内容,未经允许不得转载,如需转载请自行联系原作者进行授权。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。