- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

如何快速准备高质量的视频标注数据？

徐波发表于 2021/06/17 20:54:28 2021/06/17

【摘要】随着AI的快速发展，如何快速准备大量高质量的数据已经成为AI开发过程中一个极具挑战性的问题！随着视频监控、抖音等短视频APP的快速发展，视频数据越来越多，应用也越来越广，比如人脸识别门禁、人脸识别考勤、交通违规识别、智能交通等，这些AI技术的应用离不开视频及其标注数据的准备。本教程将基于视频类型的数据集，指导您如何使用华为云ModelArts对视频类数据进行快速标注，得到高质量的视频标注数据。

如何快速准备高质量的视频标注数据？

随着AI的快速发展，如何快速准备大量高质量的数据已经成为AI开发过程中一个极具挑战性的问题！随着视频监控、抖音等短视频APP的快速发展，视频数据越来越多，应用也越来越广，比如人脸识别门禁、人脸识别考勤、交通违规识别、智能交通等，这些AI技术的应用离不开视频及其标注数据的准备。本教程将基于视频类型的数据集，指导您如何使用华为云ModelArts对视频类数据进行快速标注，得到高质量的视频标注数据。标注后的数据集，经过发布即可用于模型训练和部署AI应用等。

数据准备

参考此文档，完成ModelArts准备工作。包括注册华为云账号、ModelArts全局配置和OBS相关操作。
ModelArts产品地址。可以边看博客边实际操作：https://console.huaweicloud.com/modelarts/?region=cn-north-4#/dataset

下载数据

此次体验数据包含9个短视频。需要从AI Gallery下载数据至OBS。视频的数据集名字为：交通违规。
首先进入AI Gallery，选择数据，然后搜索dataset-video-9

创建数据集

创建视频数据集，输入路径选择从Gallery下载数据的位置。并添加"person"，“car”的标签

开始标注

数据集详情页中，展示了此数据集中 “未标注” 和 “已标注” 的视频。

标注栏与物体检测类似，支持画框、多边形、圆、实线、虚线、点的标注。

在“未标注”页签左侧视频列表中，单击目标视频文件，打开标注页面。
在标注页面中，播放视频，当视频播放至待标注时间时，单击进度条中的暂停按钮，将视频暂停至某一画面。
在左侧区域选择标注框，默认为矩形框。使用鼠标在视频画面中框出目标，然后在弹出的添加标签文本框中，直接输入新的标签名，在文本框前面选中标签颜色，单击“添加”完成1个物体的标注。如果已存在标签，从下拉列表中选择已有的标签，然后单击“添加”完成标注。逐步此画面中所有物体所在位置，一张画面可添加多个标签。
- 示例1：对交通违规情况所在帧进行标注：斑马线车辆未礼让行人
- 示例2：无牌车辆闯红灯
上一个暂停画面标注完成后，在进度条处单击播放按钮继续播放，在需要标注的画面中暂停，然后继续标注目标物体。界面右侧将呈现当前视频带标注的时间点。
修改标注

在界面右上角点击标签类别，可显示当前文件标签：

当数据完成标注后，您还可以进入“已标注”页签，删除标注数据。
- 单击目标编号操作列的，删除该段视频的标注。您也可以单击标注视频文件上方的叉号删除标注，然后单击“确认标注”。
在“已标注”页签下，单击目标视频文件，在标注页面右侧的**“当前文件标签”**下，可单击时间点右侧小三角展开详情，您可以修改或删除标签。
- 修改标签：单击标签右侧的编辑按钮，标签名称可进行修改。
- 删除标签：单击标签右侧的删除按钮，将直接删除此标签。如果单击画面时间右侧的删除按钮，将删除此画面下的所有标签。

发布数据集

标注完成后，可以发布版本，会将当前数据集数据存档。

数据集发布后，相关文件的目录结构说明：

由于数据集是基于OBS目录管理的，发布为新版本后，对应的数据集输出位置，也将基于新版本生成目录。

在数据集发布后，其相关文件的目录结构如下。

其manifest文件存放在此目录下：

标注结果文件(XML)为VOC格式，存放在数据集输出目录下：

|-- user-specified-output-path 
    |-- DatasetName-datasetId 
        |-- annotation 
            |-- VersionMame1 
                |-- VersionMame1.manifest 
                |-- annotations
                   |-- images
                       |-- videoName1
                          |-- videoName1.timestamp.xml 
                       |-- videoName2
                          |-- videoName2.timestamp.xml
            |-- VersionMame2
                ...
            |-- ...

视频标注的关键帧存在数据集的输入目录下：

|-- user-specified-input-path 
    |-- images
        |-- videoName1 
            |-- videoName1.timestamp.jpg 
        |-- videoName2 
            |-- videoName2.timestamp.jpg

参考：
【1】华为云ModelArts文档中心：https://support.huaweicloud.com/bestpractice-modelarts/modelarts_10_0018.html
【2】如何快速准备高质量的AI数据？ https://bbs.huaweicloud.com/blogs/261979
【3】更多功能：https://bbs.huaweicloud.com/blogs/262413
【4】ModelArts产品地址：https://console.huaweicloud.com/modelarts/?region=cn-north-4#/dataset

【声明】本内容来自华为云开发者社区博主，不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源（华为云社区）、文章链接、文章作者等基本信息，否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@huaweicloud.com

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

如何快速准备高质量的视频标注数据？

如何快速准备高质量的视频标注数据？

数据准备

下载数据

创建数据集

开始标注

发布数据集

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品