【第11篇】微软发布的Dynamic Head,创造COCO新记录:60.6AP
微软发布的Dynamic Head,创造COCO新记录:60.6AP
论文地址:https://arxiv.org/pdf/2106.08322.pdf
摘要
在目标检测中结合定位和分类的复杂性导致了方法的蓬勃发展。以前的工作试图提高各种物体检测头的性能,但未能呈现出统一的观点。在本文中,我们提出了一种新颖的动态头部框架,以将目标检测头部与注意力统一起来。通过在尺度感知的特征级别之间、空间感知的空间位置之间以及任务感知的输出通道内相干地组合多个自注意力机制,所提出的方法显着提高了对象检测头的表示能力,而无需任何计算开销。进一步的实验证明了所提出的动态头在 COCO 基准上的有效性和效率。使用标准的 ResNeXt-101-DCN 主干,我们大大提高了流行对象检测器的性能,并在 54.0 AP 上实现了新的最新技术。此外,借助最新的变压器主干和额外数据,我们可以将当前最佳 COCO 结果推至 60.6 AP 的新记录。代码将在 https://github.com/microsoft/DynamicHead 上发布。
1 简介
物体检测是回答计算机视觉应用中“什么物体位于何处”的问题。在深度学习时代,几乎所有现代物体检测器 [11, 23, 12,35, 28, 31, 33] 共享相同的范式– 特征提取的主干和定位和分类任务的负责人。如何提高物体检测头的性能已经成为现有物体检测工作中的关键问题。
开发一个好的物体检测头的挑战可以概括为三类。首先,头部应该是尺度感知的,因为具有截然不同尺度的多个对象通常共存于一个图像中。其次
文章来源: wanghao.blog.csdn.net,作者:AI浩,版权归原作者所有,如需转载,请联系作者。
原文链接:wanghao.blog.csdn.net/article/details/120365468
- 点赞
- 收藏
- 关注作者
评论(0)