口罩数据集总结,maskSet4k 带标签面罩数据集示例

举报
墨理学AI 发表于 2022/02/18 11:51:59 2022/02/18
【摘要】 口罩数据集
  • 🎉 声明: 作为全网 AI 领域 干货最多的博主之一,❤️ 不负光阴不负卿 ❤️
  • 1-0


    面罩数据集 | 下载自荐| 感谢支持


    • 面罩数据集:

      为什么是面罩:因为国内口罩类型种类繁多,因此这里把凡是类似口罩形状能够完全掩面的图片均标注为带了口罩(mask)。

    • 原始数据主要来源:

      SCUT-FBP5500_v2.1–亚洲人脸;
      明星工作照片(机场、发布会、运动场地)多为爬虫所得;
      整合其他一些没有 labels 的口罩数据集;

    • 我所做的主要工作(数据打标+精选)如下:

       一:使用pytorch 版本 yolov5 进行二分类 mask 检测,首次模型训练15天,对数据打标;
      
       二:数据+标签,人工筛选
       
      
       三:打标数据更新数据集再次训练,提升模型精度
      
       四:二三步骤反复迭代 三次,最终得到 准确率(accuracy)高达 0.995 ,召回率 0.99 的检测模型;
      
       五:对数据标签的再次人工筛选,整理得到 **maskSet4k** 数据集;
      
       六:可有偿发布该数据集(因为成果已经沉淀下去,该数据集属个人之前阶段学习兴趣总结所得,研究方向已换,后续价值有限)
      

    基础分享如下:


    小的目标检测数据集下载链接:

    当前最好的开源口罩数据集:

    面罩数据集样本–带标签(口罩数据 100 + 人脸数据 100)


    本次 maskSet4k 口罩数据集,主要包含内容如下:


    下载压缩包之后,解压内容如下:

    1

    不带口罩数据,示例如下:

    2

    带面罩数据,示例如下:

    3


    该数据集主要特点如下:


    • 训练数据量 4k, mask 和 unmak 比例 1:1;
    • 标注准确率极高,因为模型迭代训练一个月的过程中,自己做人工检测和数据标签修正花费2个周末;
    • 对于一个图片中存在多张人脸,会有部分人脸没有标签,因为模型检测不到(或者无法判断),那这样的人脸就是没有标签的;但是对于模型训练而言,这样的数据是没有影响的;
    • 现有公开口罩数据集特点:数据量小,不带标签或者标签很不准确,本数据集有质量保证
    • 网上下载的口罩数据集,通常需要花费精力整理和筛选才能够真正使用
    • 该数据为真实场景佩戴的口罩(非模拟)
    • 仅适用于二分类(戴口罩 0 与 不戴 1),口罩检测
    • 非免费提供

    声明:该资源下载所得数据集,可自行研究使用、学术、工业皆可,请勿在互联网途径传播;

    🚀🚀 AI之路、道阻且长


    📙 博主 AI 领域八大干货专栏、诚不我欺


    📙 预祝各位 前途似锦、可摘星辰


  • 🎉 作为全网 AI 领域 干货最多的博主之一,❤️ 不负光阴不负卿 ❤️
  • ❤️ 过去的每一天、想必你也都有努力、祝你披荆斩棘、未来可期
  • image.png

    【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
    • 点赞
    • 收藏
    • 关注作者

    评论(0

    0/1000
    抱歉,系统识别当前为高风险访问,暂不支持该操作

    全部回复

    上滑加载中

    设置昵称

    在此一键设置昵称,即可参与社区互动!

    *长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

    *长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。