如何快速准备高质量的视频标注数据?

举报
徐波 发表于 2021/06/17 20:54:28 2021/06/17
【摘要】 随着AI的快速发展,如何快速准备大量高质量的数据已经成为AI开发过程中一个极具挑战性的问题!随着视频监控、抖音等短视频APP的快速发展,视频数据越来越多,应用也越来越广,比如人脸识别门禁、人脸识别考勤、交通违规识别、智能交通等,这些AI技术的应用离不开视频及其标注数据的准备。本教程将基于视频类型的数据集,指导您如何使用华为云ModelArts对视频类数据进行快速标注,得到高质量的视频标注数据。

如何快速准备高质量的视频标注数据?

随着AI的快速发展,如何快速准备大量高质量的数据已经成为AI开发过程中一个极具挑战性的问题!随着视频监控、抖音等短视频APP的快速发展,视频数据越来越多,应用也越来越广,比如人脸识别门禁、人脸识别考勤、交通违规识别、智能交通等,这些AI技术的应用离不开视频及其标注数据的准备。本教程将基于视频类型的数据集,指导您如何使用华为云ModelArts对视频类数据进行快速标注,得到高质量的视频标注数据。标注后的数据集,经过发布即可用于模型训练和部署AI应用等。

数据准备

下载数据

  • 此次体验数据包含9个短视频。需要从AI Gallery下载数据至OBS。视频的数据集名字为:交通违规。

  • 首先进入AI Gallery,选择数据,然后搜索dataset-video-9

创建数据集

  • 创建视频数据集,输入路径选择从Gallery下载数据的位置。并添加"person",“car”的标签

开始标注

数据集详情页中,展示了此数据集中 “未标注”“已标注” 的视频。

标注栏与物体检测类似,支持画框、多边形、圆、实线、虚线、点的标注。

  • 在“未标注”页签左侧视频列表中,单击目标视频文件,打开标注页面。

  • 在标注页面中,播放视频,当视频播放至待标注时间时,单击进度条中的暂停按钮,将视频暂停至某一画面。

  • 在左侧区域选择标注框,默认为矩形框。使用鼠标在视频画面中框出目标,然后在弹出的添加标签文本框中,直接输入新的标签名,在文本框前面选中标签颜色,单击“添加”完成1个物体的标注。如果已存在标签,从下拉列表中选择已有的标签,然后单击“添加”完成标注。逐步此画面中所有物体所在位置,一张画面可添加多个标签。

    • 示例1:对交通违规情况所在帧进行标注:斑马线车辆未礼让行人
    • 示例2:无牌车辆闯红灯

  • 上一个暂停画面标注完成后,在进度条处单击播放按钮继续播放,在需要标注的画面中暂停,然后继续标注目标物体。界面右侧将呈现当前视频带标注的时间点。

  • 修改标注

    在界面右上角点击标签类别,可显示当前文件标签:

    当数据完成标注后,您还可以进入“已标注”页签,删除标注数据。

    • 单击目标编号操作列的img,删除该段视频的标注。您也可以单击标注视频文件上方的叉号删除标注,然后单击“确认标注”。

    在“已标注”页签下,单击目标视频文件,在标注页面右侧的**“当前文件标签”**下,可单击时间点右侧小三角展开详情,您可以修改或删除标签。

    • 修改标签:单击标签右侧的编辑按钮,标签名称可进行修改。
    • 删除标签:单击标签右侧的删除按钮,将直接删除此标签。如果单击画面时间右侧的删除按钮,将删除此画面下的所有标签。

发布数据集

标注完成后,可以发布版本,会将当前数据集数据存档。

数据集发布后,相关文件的目录结构说明:

由于数据集是基于OBS目录管理的,发布为新版本后,对应的数据集输出位置,也将基于新版本生成目录。

在数据集发布后,其相关文件的目录结构如下。

其manifest文件存放在此目录下:

标注结果文件(XML)为VOC格式,存放在数据集输出目录下:

|-- user-specified-output-path 
    |-- DatasetName-datasetId 
        |-- annotation 
            |-- VersionMame1 
                |-- VersionMame1.manifest 
                |-- annotations
                   |-- images
                       |-- videoName1
                          |-- videoName1.timestamp.xml 
                       |-- videoName2
                          |-- videoName2.timestamp.xml
            |-- VersionMame2
                ...
            |-- ...

视频标注的关键帧存在数据集的输入目录下:

|-- user-specified-input-path 
    |-- images
        |-- videoName1 
            |-- videoName1.timestamp.jpg 
        |-- videoName2 
            |-- videoName2.timestamp.jpg 

参考:
【1】华为云ModelArts文档中心:https://support.huaweicloud.com/bestpractice-modelarts/modelarts_10_0018.html
【2】如何快速准备高质量的AI数据? https://bbs.huaweicloud.com/blogs/261979
【3】更多功能:https://bbs.huaweicloud.com/blogs/262413
【4】ModelArts产品地址:https://console.huaweicloud.com/modelarts/?region=cn-north-4#/dataset

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。