- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

Yolov5更换上采样方式( 最近邻 / 双线性 / 双立方 / 三线性 / 转置卷积)

迪菲赫尔曼发表于 2023/01/03 13:46:11 2023/01/03

【摘要】 Yolov5更换上采样方式前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站。@[toc] 常用上采样方式介绍 1. 最近邻插值(Nearest neighbor interpolation)>>> input = torch.arange(1, 5, dtype=torch.float32).view(1, 1, 2, 2)>>> input...

Yolov5更换上采样方式

前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站。

@[toc]

常用上采样方式介绍

1. 最近邻插值(Nearest neighbor interpolation)

>>> input = torch.arange(1, 5, dtype=torch.float32).view(1, 1, 2, 2)
>>> input
tensor([[[[ 1.,  2.],
          [ 3.,  4.]]]])
          
>>> m = nn.Upsample(scale_factor=2, mode='nearest')
>>> m(input)
tensor([[[[ 1.,  1.,  2.,  2.],
          [ 1.,  1.,  2.,  2.],
          [ 3.,  3.,  4.,  4.],
          [ 3.,  3.,  4.,  4.]]]])

2. 双线性插值(Bi-Linear interpolation)

![在这里插入图片描述](https://img-blog.csdnimg.cn/42366220c9424c68a656d52952c3d2e4.png#pic_center =50%x)

>>> input = torch.arange(1, 5, dtype=torch.float32).view(1, 1, 2, 2)
>>> input
tensor([[[[ 1.,  2.],
          [ 3.,  4.]]]])
          
>>> m = nn.Upsample(scale_factor=2, mode='bilinear')  # align_corners=False
>>> m(input)
tensor([[[[ 1.0000,  1.2500,  1.7500,  2.0000],
          [ 1.5000,  1.7500,  2.2500,  2.5000],
          [ 2.5000,  2.7500,  3.2500,  3.5000],
          [ 3.0000,  3.2500,  3.7500,  4.0000]]]])
          
>>> m = nn.Upsample(scale_factor=2, mode='bilinear', align_corners=True)
>>> m(input)
tensor([[[[ 1.0000,  1.3333,  1.6667,  2.0000],
          [ 1.6667,  2.0000,  2.3333,  2.6667],
          [ 2.3333,  2.6667,  3.0000,  3.3333],
          [ 3.0000,  3.3333,  3.6667,  4.0000]]]])

3. 双立方插值(Bi-Cubic interpolation)

>>> input = torch.arange(1, 5, dtype=torch.float32).view(1, 1, 2, 2)
>>> input
tensor([[[[ 1.,  2.],
          [ 3.,  4.]]]])
          
>>> m = nn.Upsample(scale_factor=2, mode='bicubic') # align_corners=False
>>> m(input)
tensor([[[[0.6836, 1.0156, 1.5625, 1.8945],
          [1.3477, 1.6797, 2.2266, 2.5586],
          [2.4414, 2.7734, 3.3203, 3.6523],
          [3.1055, 3.4375, 3.9844, 4.3164]]]])

>>> m = nn.Upsample(scale_factor=2, mode='bicubic', align_corners=True)
>>> m(input)
tensor([[[[1.0000, 1.3148, 1.6852, 2.0000],
          [1.6296, 1.9444, 2.3148, 2.6296],
          [2.3704, 2.6852, 3.0556, 3.3704],
          [3.0000, 3.3148, 3.6852, 4.0000]]]])

计算效果：最近邻插值算法 < 双线性插值 < 双三次插值
计算速度：最近邻插值算法 > 双线性插值 > 双三次插值

4. 三线性插值(Trilinear Interpolation)

当align_corners = True时，线性插值模式(线性、双线性、双三线性和三线性)不按比例对齐输出和输入像素，因此输出值可以依赖于输入的大小

![在这里插入图片描述](https://img-blog.csdnimg.cn/316b5b48b9b34c0b8ee07038bdbb31e5.png#pic_center =60%x)

5. 反池化

6. 转置卷积

![在这里插入图片描述](https://img-blog.csdnimg.cn/6040031767f2442eb24c99d7690772bc.png#pic_center =70%x)

yolov5默认采用的就是最近邻插值
![在这里插入图片描述](https://img-blog.csdnimg.cn/43ded1ee85e9422f94d6149c491ec393.png#pic_center =70%x)

实验结果

这里我将原本的最近邻插值的上采样方式替换为转置卷积；有人通过实验证明了确实涨点，但是我在==VOC数据集==上测试==并没有涨点==，mAP0.5大概掉了不到1点
![请添加图片描述](https://img-blog.csdnimg.cn/3b7c3129029e4a61abc0ce063d2201df.png#pic_center =70%x)

修改方式：

第一步；在models/yolo.py添加nn.ConvTranspose2d![在这里插入图片描述](https://img-blog.csdnimg.cn/0ac78033dc4d4672ab5d7e87b8cbb7ba.png#pic_center =70%x)

第二步；models/yolo.py添加如下代码

![在这里插入图片描述](https://img-blog.csdnimg.cn/b8af91c978c145d4ba48297db7b1039e.png#pic_center =70%x)

 elif m is nn.ConvTranspose2d:
                if len(args) >= 7:
                    args[6] = make_divisible(args[6] * gw, 8)

第三步；修改配置文件，以yolov5s.yaml为例

# YOLOv5 🚀 by Ultralytics, GPL-3.0 license

# Parameters
nc: 80  # number of classes
depth_multiple: 0.33  # model depth multiple
width_multiple: 0.50  # layer channel multiple
anchors:
  - [10,13, 16,30, 33,23]  # P3/8
  - [30,61, 62,45, 59,119]  # P4/16
  - [116,90, 156,198, 373,326]  # P5/32

# YOLOv5 v6.0 backbone
backbone:
  # [from, number, module, args]
  [[-1, 1, Conv, [64, 6, 2, 2]],  # 0-P1/2
   [-1, 1, Conv, [128, 3, 2]],  # 1-P2/4
   [-1, 3, C3, [128]],
   [-1, 1, Conv, [256, 3, 2]],  # 3-P3/8
   [-1, 6, C3, [256]],
   [-1, 1, Conv, [512, 3, 2]],  # 5-P4/16
   [-1, 9, C3, [512]],
   [-1, 1, Conv, [1024, 3, 2]],  # 7-P5/32
   [-1, 3, C3, [1024]],
   [-1, 1, SPPF, [1024, 5]],  # 9
  ]


# YOLOv5 v6.0 head
head:
  [[-1, 1, Conv, [512, 1, 1]],
   [-1, 1, nn.ConvTranspose2d, [512, 4, 2, 1, 0, 512]],
   [[-1, 6], 1, Concat, [1]],  # cat backbone P4
   [-1, 3, C3, [512, False]],  # 13

   [-1, 1, Conv, [256, 1, 1]],
   [-1, 1, nn.ConvTranspose2d, [256, 4, 2, 1, 0, 256]],
   [[-1, 4], 1, Concat, [1]],  # cat backbone P3
   [-1, 3, C3, [256, False]],  # 17 (P3/8-small)

   [-1, 1, Conv, [256, 3, 2]],
   [[-1, 14], 1, Concat, [1]],  # cat head P4
   [-1, 3, C3, [512, False]],  # 20 (P4/16-medium)

   [-1, 1, Conv, [512, 3, 2]],
   [[-1, 10], 1, Concat, [1]],  # cat head P5
   [-1, 3, C3, [1024, False]],  # 23 (P5/32-large)

   [[17, 20, 23], 1, Detect, [nc, anchors]],  # Detect(P3, P4, P5)
  ]

出现下面这样子就是运行成功啦

前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站。

本人更多YOLOv5实战内容导航🍀🌟🚀

有问题欢迎大家指正，如果感觉有帮助的话请点赞支持下👍📖🌟

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

Yolov5更换上采样方式( 最近邻 / 双线性 / 双立方 / 三线性 / 转置卷积)

Yolov5更换上采样方式

常用上采样方式介绍

1. 最近邻插值(Nearest neighbor interpolation)

2. 双线性插值(Bi-Linear interpolation)

3. 双立方插值(Bi-Cubic interpolation)

4. 三线性插值(Trilinear Interpolation)

5. 反池化

6. 转置卷积

实验结果

修改方式：

本人更多YOLOv5实战内容导航🍀🌟🚀

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

Yolov5更换上采样方式( 最近邻 / 双线性 / 双立方 / 三线性 / 转置卷积)

Yolov5更换上采样方式

常用上采样方式介绍

1. 最近邻插值(Nearest neighbor interpolation)

2. 双线性插值(Bi-Linear interpolation)

3. 双立方插值(Bi-Cubic interpolation)

4. 三线性插值(Trilinear Interpolation)

5. 反池化

6. 转置卷积

实验结果

修改方式：

本人更多YOLOv5实战内容导航🍀🌟🚀

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

推荐阅读

相关产品