YOLO V4 论文阅读与总结

举报
lutianfei 发表于 2021/08/09 23:43:15 2021/08/09
【摘要】 目标检测领域训练技巧参考论文:《Bag of Freebies for Training Object Detection Neural》yolo v4 的意义对调优手段做出了很好的总结Bag of freebiesBag of specials创新提出了Mosaic数据增强方法创新提出了自对抗训练方法改进SAM,改进PAN,和交叉小批量标准化CmBN,使网络设计适合于有效的训练和检测。 B...

目标检测领域训练技巧

参考论文:《Bag of Freebies for Training Object Detection Neural》

yolo v4 的意义

  1. 对调优手段做出了很好的总结
  • Bag of freebies
  • Bag of specials
  1. 创新提出了Mosaic数据增强方法
  2. 创新提出了自对抗训练方法
  3. 改进SAM,改进PAN,和交叉小批量标准化CmBN,使网络设计适合于有效的训练和检测。

Bag of freebies 离线训练技巧

image.png

  1. 数据增强
  • 增强输入图像的可变性
  • 使检测模型具有更高的鲁棒性
    包括:
    A、光照处理:亮度、对比度、色相、饱和度、噪点
    B、几何处理:缩放、裁剪、翻转、旋转
  1. 对象遮挡
    image.png

image.png

image.png

  1. 用多图来进行增强
  • MixUp 用两张图合成
  • CutMix 用不同角度的裁剪区域
  1. 用GAN扩充数据

  2. 数据分布不均衡
    解决方法:OHEM, S-OHEM,A-Fast-RCNN, Focal loss GHM

  3. 类别关联度

  4. 目标框回归函数

Bag of specials 推断过程中增加些许成本换来较大的精度提升技巧

image.png

  1. 增加感受野
    特征金字塔SPP、RFB、ASPP

  2. attention
    通道注意力机制SE
    空间注意力机制SAM

  3. 特征融合
    skip connection
    Hyper column
    FPN: SFAM、ASFF、BiFPN

  4. 激活函数
    Mish 与众多激活函数的对比
    image.png

Mish的优点:

  • 以上无边界(即正值可以达到任何高度)避免了由于封顶而导致的饱和。理论上对负值的轻微允许 更好的梯度流,而不是想ReLU中那样的硬零边界。

  • 平滑的激活函数允许更好的信息深入神经网络,从而得到更好的准确性和泛化。

image.png

论文创新点

image.png

image.png

image.png

image.png

image.png

image.png

image.png

  1. 后处理方式
    NMS
【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。