模型评估中目标检测模型的目标框高宽比感度分析以及相关的解决方法

举报
talking_cv 发表于 2020/08/18 11:34:35 2020/08/18
【摘要】 在目标检测任务中,不同数据集的目标框的高宽比可能会有差异,目标框高宽比敏感度就是衡量这个差异的变量,而不同的目标框高宽比的数值对模型训练以及推理都会有影响。本博客将对该敏感度进行分析并对相关的解决方法进行介绍

一、 问题描述

  在目标检测任务中,一张图片的的不同目标框的形状是多种多样的,目标框的高宽比就是描述这种现象的指标,如果数据集目标框的高宽比分布范围越广,那么表示该数据集目标框形状越不均衡,检测模型对于具有不同宽高比数据集的检测效果是不一样的,那么如果降低模型对于目标框宽高比的敏感程度呢,下面对相关的技术进行介绍。下图是一张图片中的目标框高宽比举例,可以看到,该图片中目标框的高宽比总共有三个数值。


image.png

图1 目标框高宽比举例

二、解决方法

  在目标检测任务中,FPN在one stage检测模型中应用比较广泛,FPN通过特征融合,将不同尺度的feature map进行concat,然后进行后面的类别以及目标框的回归,已经成为检测模型中的一种标配手段。在EfficientDet论文中,提出了一种FPN block repeats的手段,即将之前的FPN作为一个基本单元,进行重复叠加,来进行特征提取层的融合,下图是EfficientDet的BiFPN基本单元,主要是对FPN进行适当的修改。

image.png

图2 BiFPN结构示意图

  下图是对BiFPN进行了重复叠加,即FPN block repeats,可以看到特征提取层更深。

image.png

图3 EfficientDet的FPN block repeats

  FPN block repeats不仅适用于BiFPN,也可应用于其他的FPN结构,例如PANet的FPN,下图是将FPN block repeats技术应用在了PANet上面。

image.png

图4 FPN block repeats的构造示意图,其中,a图表示PANet的基本单元结构,b图表示带有FPN block repeats的网络

三、实验验证

  在开源数据集fruit上面进行实验,使用FPN block repeats之前,对目标框的高宽比敏感度分析如下所示,可以看到Apple和banana的宽高比敏感度分别是0.0757和0.4481。

image.png

图5 使用FPN block repeats之前,检测模型对目标框高宽比敏感度分析


  使用FPN block repeats之后,对目标框的高宽比敏感度进行分析,如下所示,可以看到,Apple的目标框高宽比敏感度从原来的0.0757降低到0.0667,banana的目标框高宽比敏感度从原来的0.4481降低到0.4091。

image.png

图6 使用FPN block repeats之后,检测模型对目标框高宽比敏感度分析

  可以看到,使用FPN block repeats之后,目标框的高宽比敏感度得到了比较大的改善

四、用户建议

  在模型推理结果中,如果检测出来的类别对于目标框高宽比的敏感程度比较大,推荐在训练的时候,使用带有FPN block repeats的检测模型进行优化训练。


参考链接:

  1. EfficientDet: Scalable and Efficient Object Detection(https://arxiv.org/abs/1911.09070

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。