CondConv论文笔记

举报
嘿哈 发表于 2020/06/12 17:21:47 2020/06/12
【摘要】 https://arxiv.org/pdf/1904.04971.pdf 首先说一下条件计算:条件计算是构建一种动态的网络结构,每次推断的时候先有决策网络(模块)根据模型输入(甚至每一层的输入)推断出所要使用的网络部件,然后利用原始网络的一个子集完成实际推断。 本文的核心思想是:由于不同的卷积核提取到的特征是不相同的,而不同的样本之间的特征是有差异的,所以设计了一种可...

https://arxiv.org/pdf/1904.04971.pdf

       首先说一下条件计算:条件计算是构建一种动态的网络结构,每次推断的时候先有决策网络(模块)根据模型输入(甚至每一层的输入)推断出所要使用的网络部件,然后利用原始网络的一个子集完成实际推断。

       本文的核心思想是:由于不同的卷积核提取到的特征是不相同的,而不同的样本之间的特征是有差异的,所以设计了一种可以根据不同样本变化的自适应卷积核。即在卷积层设置多套卷积核,在推断时对这多套卷积核施加一个类似于SE的模块,对每个卷积核进行权重的学习,学习是依靠样本的,然后所有卷积核加起来,作为最终的卷积核,类似于多个专家共同决策。所以网络的参数量增加的很多,但实际前向花费的时间并没有增加多少。下图是它的结构图。

image.png

W为卷积核,x为输入,α= r(x)R是待学习的权重参数

image.png


Table 1ImageNet的结果,在最新的一些网络上还是有一定提升

image.png

Table 2coco检测结果,采用的SSD十分老的网络,不知道在mask上面效果怎么样。

image.png


Table 3为不同的权重组合方式结果,使用Hidden(传统的SE)作用不明显。作者为了试验这个组合方式估计花了很久的时间。


image.png

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。