- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

【图像分类】YOLOv5-6.2全新版本：支持图像分类

zstar 发表于 2022/08/20 23:59:50 2022/08/20

【摘要】前言众所周知，YOLOv5是一款优秀的目标检测模型，但实际上，它也支持图像分类。在6.1版本中，就暗留了classify这个参数，可以在做检测的同时进行分类。官方仓库地址：https://gith...

前言

众所周知，YOLOv5是一款优秀的目标检测模型，但实际上，它也支持图像分类。在6.1版本中，就暗留了classify这个参数，可以在做检测的同时进行分类。

官方仓库地址：https://github.com/ultralytics/yolov5/releases

更新概览

在几天前刚新出的6.2版本中，直接将分类功能单独剥离开来，使其能够直接训练图像分类数据集。

先看看官网公示的更新说明：

分类功能
新增分类功能，并提供各模型在ImageNet上训练过的预训练模型
ClearML日志记录
与开源实验跟踪器ClearML集成。使用pip安装clearml将启用集成，并允许用户跟踪clearml中的每个训练运行。
Deci.ai优化
在Deci上单击一次即可自动编译和量化YOLOv5，从而获得更好的性能
GPU导出基准
可以使用python utils/benchmarks.py --weights yolov5s.pt --device 0来导出Benchmark (mAP and speed)
训练可完全复现
torch>=1.12.0的单GPU YOLOv5训练现在完全可再现，并且可以使用新的–seed参数（默认seed=0）
优化Apple炼丹体验
Apple Metal Performance Shader(MPS：苹果炼丹工具) 支持Apple M1/M2设备

在这些更新中，我最关注的是图像分类功能，那么本篇就来尝试跑通一下。

分类模型效果

下图是官方贴出来的各分类模型对比图，在可以看到在相同的数据集上，YOLOv5x-cls模型取得了最佳的准确率。下列这些模型官方均提供预训练权重。

工程结构

首先看新版本的工程结构，和前几个版本差别不大。主要是多了一个classify文件夹，包含图像分类训练，验证，检测三个函数。

训练结果会保存在runs/train-cls文件夹中。

数据集下载

在train.py中，提供这段数据集下载程序段：

# Download Dataset
with torch_distributed_zero_first(LOCAL_RANK), WorkingDirectory(ROOT):
    data_dir = data if data.is_dir() else (DATASETS_DIR / data)
    if not data_dir.is_dir():
        LOGGER.info(f'\nDataset not found ⚠️, missing path {data_dir}, attempting download...')
        t = time.time()
        if str(data) == 'imagenet':
            subprocess.run(f"bash {ROOT / 'data/scripts/get_imagenet.sh'}", shell=True, check=True)
        else:
            url = f'https://github.com/ultralytics/yolov5/releases/download/v1.0/{data}.zip'
            download(url, dir=data_dir.parent)
        s = f"Dataset download success ✅ ({time.time() - t:.1f}s), saved to {colorstr('bold', data_dir)}\n"
        LOGGER.info(s)

  
 
  1
  2
  3
  4
  5
  6
  7
  8
  9
  10
  11
  12
  13

如果指定的数据集路径下没有数据集，会从官方仓库v1.0的版本中进行下载。这里我建议是手动去进行下载，受限于网络情况，自动下载很容易失败。

可以看到，在官方仓库v1.0版本中的Assets中包含了很多数据集，我下载了最经典的mnist的数据集来做测试。

下载完之后，需要在本地进行解压，解压之后的数据集格式如下图所示：

禁用wandb

训练之前，可以选择禁用wandb，wandb是和tensorboard类似的数据记录平台，为了防止报错，可以用下面的方式进行禁用。

在终端环境中输入wandb disabled

同时在utils/loggers/wandb/__init__.py中添加wandb = None

try:
    import wandb

    assert hasattr(wandb, '__version__')  # verify package import not local dir
    if pkg.parse_version(wandb.__version__) >= pkg.parse_version('0.12.2') and RANK in {0, -1}:
        try:
            wandb_login_success = wandb.login(timeout=30)
        except wandb.errors.UsageError:  # known non-TTY terminal issue
            wandb_login_success = False
        if not wandb_login_success:
            wandb = None
except (ImportError, AssertionError):
    wandb = None
# 添加以下语句
wandb = None

  
 
  1
  2
  3
  4
  5
  6
  7
  8
  9
  10
  11
  12
  13
  14
  15

在utils/loggers/wandb/wandb_utils.py中同样添加

try:
    import wandb

    assert hasattr(wandb, '__version__')  # verify package import not local dir
except (ImportError, AssertionError):
    wandb = None
# 添加以下语句
wandb = None

  
 
  1
  2
  3
  4
  5
  6
  7
  8

开始训练

在train.py中主要修改下面一些超参数，基本和目标检测类似，值得注意的是图像分类训练中，并不需要指定模型结构，模型结构完全包含在了预训练模型中，使用起来更为方便。如果需要深入了解YOLO模型是如何引出分类的，可以导出ONNX模型，再使用netron查看。

训练完成之后，会自动调用测试程序，绘制测试结果。

可以看到，我只使用YOLOv5-cls模型训练了10个epoch，就在mnist上取得了不错的效果。

模型预测

模型预测更简单，指定训练好的权重weights，输入图像source，图像尺寸imgsz即可。

模型会从高到低输出前5个类别的概率值。

代码备份

本次实验代码包含YOLOv5-6.2版本提供的所有预训练权重和mnist数据集。
备份地址：https://pan.baidu.com/s/1msi5qaE82nEbCha641lkPA?pwd=8888

文章来源: zstar.blog.csdn.net，作者：zstar-_，版权归原作者所有，如需转载，请联系作者。

原文链接：zstar.blog.csdn.net/article/details/126432538

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

【图像分类】YOLOv5-6.2全新版本：支持图像分类

前言

更新概览

分类模型效果

工程结构

数据集下载

禁用wandb

开始训练

模型预测

代码备份

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

【图像分类】YOLOv5-6.2全新版本：支持图像分类

前言

更新概览

分类模型效果

工程结构

数据集下载

禁用wandb

开始训练

模型预测

代码备份

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品