阅读ResNet论文

举报
黄生 发表于 2025/02/07 20:14:16 2025/02/07
170 0 0
【摘要】 《Deep Residual Learning for Image Recognition》是由Kaiming He、Xiangyu Zhang、Shaoqing Ren和Jian Sun在2015年发表的一篇关于深度学习和图像识别的重要论文。 1. 论文背景深度卷积神经网络CNN在图像分类任务中取得了显著的突破。然而,随着网络深度的增加,训练更深的网络变得越来越困难,出现了梯度消失/爆炸的...

《Deep Residual Learning for Image Recognition》是由Kaiming He、Xiangyu Zhang、Shaoqing Ren和Jian Sun在2015年发表的一篇关于深度学习和图像识别的重要论文。

1. 论文背景

  • 深度卷积神经网络CNN在图像分类任务中取得了显著的突破。然而,随着网络深度的增加,训练更深的网络变得越来越困难,出现了梯度消失/爆炸的问题。
  • 梯度消失/爆炸问题虽然通过归一化初始化和中间归一化层得到了部分解决,但更深的网络仍然面临训练困难和性能下降的问题(称为退化问题)。

2. 研究动机

  • 深度的重要性:深度网络能够自然地整合低级、中级和高级特征,从而提高分类性能。
  • 退化问题:当网络深度增加时,训练误差不仅没有降低,反而增加,这表明优化更深的网络存在困难。
  • 解决方案:作者提出了一种残差学习框架,通过学习输入的残差函数而不是直接学习输入的映射,来简化优化过程。

3. 核心思想

  • 残差学习:假设一个理想的映射为 ( H(x) ),作者让网络学习一个残差函数 ( F(x) = H(x) - x ),然后将原始映射表示为 ( F(x) + x )。
  • 快捷连接(Shortcut Connections):通过在层之间添加快捷连接(跳过某些层),实现残差学习。这些连接简单地执行恒等映射,将输入直接添加到输出中。

4. 方法细节

  • 残差块:每个残差块包含两个或三个卷积层,输入 ( x ) 和输出 ( y ) 之间的关系表示为 ( y = F(x, {W_i}) + x )。如果输入和输出的维度不同,则使用线性投影 ( W_s )。
  • 网络架构:作者设计了多种深度的残差网络(如34层、50层、101层和152层),并在ImageNet数据集上进行了实验。

5. 实验结果

  • ImageNet分类任务
    • 152层残差网络:在ImageNet测试集上取得了3.57%的top-5错误率,赢得了ILSVRC 2015分类任务的第一名。
    • 深度对比:相比VGG网络(16-19层),残差网络在深度和性能上都有显著提升。
  • CIFAR-10数据集
    • 110层残差网络:在CIFAR-10测试集上取得了6.43%的错误率,展示了深度残差网络在小数据集上的有效性。
    • 1202层网络:虽然训练误差很低,但测试误差较高,表明可能存在过拟合问题。

6. 关键结论

  • 残差学习:通过学习残差函数而不是直接学习映射,显著提高了深层网络的训练效果。
  • 深度的重要性:更深的网络能够获得更好的性能,但需要适当的优化方法。
  • 快捷连接:恒等映射的快捷连接在不增加参数和计算复杂度的情况下,有效地解决了退化问题。

7. 代码实现

  • 框架:作者使用Caffe框架实现了残差网络,并提供了详细的网络架构和训练细节。
  • 训练细节
    • 数据增强:使用随机裁剪和水平翻转。
    • 优化:使用随机梯度下降(SGD)和批量归一化(Batch Normalization)。
    • 学习率调整:在训练过程中逐步降低学习率。

8. 扩展应用

  • 目标检测:作者将残差网络应用于PASCAL VOC和MS COCO数据集的目标检测任务,取得了显著的性能提升。
  • 其他任务:残差网络还在ImageNet检测、定位和COCO分割任务中取得了优异的成绩。

9. 学习建议

  • 理解残差块:重点理解残差块的设计和快捷连接的作用。
  • 实验对比:通过对比不同深度的网络(如18层、34层、50层等),理解深度对性能的影响。
  • 代码实践:尝试在Caffe或其他深度学习框架中实现残差网络,加深对论文的理解。
【声明】本内容来自华为云开发者社区博主,不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

作者其他文章

评论(0

抱歉,系统识别当前为高风险访问,暂不支持该操作

    全部回复

    上滑加载中

    设置昵称

    在此一键设置昵称,即可参与社区互动!

    *长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

    *长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。