【论文阅读】增量式物体检测

举报
MUR11 发表于 2019/09/27 15:16:02 2019/09/27
【摘要】 当前主流的目标检测器模型在训练时即确定了需要检测的物体种类,如果想要增加新的类别,只能重新训练。本文介绍了一种增量式的物体检测模型,可以随时增加新的类别,更符合实际场景。

      文章信息:Konstantin Shmelkov, Cordelia Schmid, Karteek Alahari. Incremental Learning of Object Detectors without Catastrophic Forgetting. ICCV 2017.


这篇文章提出了一种针对深度学习中物体检测任务的增量式学习方法。具体来说,问题的设置为:假设在一开始的时候已经有了一个用一些数据训练得到的物体检测模型;之后又有一批新的数据,这批数据上只标注了新的、未见过的类别的bounding box和类别,增量式物体检测方法的目标是在已有模型的基础上,学习一个新的模型,可以同时检测之前的类别和新类别的物体。

这个设置的难点在于,如果不对方法进行特殊的设计,而只使用新的数据更新模型,则模型在原来的类别上的表现会非常差,这个现象被称作灾难性遗忘。为了解决这个问题,作者提出将原始模型中的知识蒸馏出来,并在更新模型的时候既对新类别进行学习,也对这部分蒸馏出来的知识进行学习,从而保证模型不会遗忘已有的知识。

具体来说,该方法的模型设计如上图所示。本文中,为了保证候选的region proposal不是针对原有模型中特定的类别,而是针对通用的物体,方法的基本架构基于Fast RCNN。当更新模型的时候,需要两个版本的模型,其中上路的Network A为原始的模型(模型参数完全固定,不进行调整),下路的Network B为可以更新的模型。模型的整体流程如下:

1.       以新类别的图像作为Network A的输入,从背景得分最低(即物体得分最高)的128RoI中随机选取64个,并在Network B中计算这64RoI的预测输出(包括分类预测的logitsbounding box regression输出),约束Network B的预测输出和相应的Network A的预测输出相同(使用L2损失进行约束,忽略Network B中对应新类别的输出项)。通过约束新模型在已有类别上的输出和旧模型在已有类别上的输出相同,保证旧类别的知识可以迁移到新模型上;

2.       针对新增的类别,使用标准的Fast RCNN损失进行训练。

从实验结果来看,这种方法相比于在具有完整标注的全部数据上训练的方式来说,性能有一定的下降,但是相比于不考虑灾难性遗忘问题的方案有明显的提升。


【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。