如何快速准备高质量的视频标注数据?
如何快速准备高质量的视频标注数据?
随着AI的快速发展,如何快速准备大量高质量的数据已经成为AI开发过程中一个极具挑战性的问题!随着视频监控、抖音等短视频APP的快速发展,视频数据越来越多,应用也越来越广,比如人脸识别门禁、人脸识别考勤、交通违规识别、智能交通等,这些AI技术的应用离不开视频及其标注数据的准备。本教程将基于视频类型的数据集,指导您如何使用华为云ModelArts对视频类数据进行快速标注,得到高质量的视频标注数据。标注后的数据集,经过发布即可用于模型训练和部署AI应用等。
数据准备
- 参考此文档,完成ModelArts准备工作。包括注册华为云账号、ModelArts全局配置和OBS相关操作。
- ModelArts产品地址。可以边看博客边实际操作:https://console.huaweicloud.com/modelarts/?region=cn-north-4#/dataset
下载数据
-
此次体验数据包含9个短视频。需要从AI Gallery下载数据至OBS。视频的数据集名字为:交通违规。
-
首先进入AI Gallery,选择数据,然后搜索dataset-video-9
创建数据集
- 创建视频数据集,输入路径选择从Gallery下载数据的位置。并添加"person",“car”的标签
开始标注
数据集详情页中,展示了此数据集中 “未标注” 和 “已标注” 的视频。
标注栏与物体检测类似,支持画框、多边形、圆、实线、虚线、点的标注。
-
在“未标注”页签左侧视频列表中,单击目标视频文件,打开标注页面。
-
在标注页面中,播放视频,当视频播放至待标注时间时,单击进度条中的暂停按钮,将视频暂停至某一画面。
-
在左侧区域选择标注框,默认为矩形框。使用鼠标在视频画面中框出目标,然后在弹出的添加标签文本框中,直接输入新的标签名,在文本框前面选中标签颜色,单击“添加”完成1个物体的标注。如果已存在标签,从下拉列表中选择已有的标签,然后单击“添加”完成标注。逐步此画面中所有物体所在位置,一张画面可添加多个标签。
- 示例1:对交通违规情况所在帧进行标注:斑马线车辆未礼让行人
-
示例2:无牌车辆闯红灯
-
上一个暂停画面标注完成后,在进度条处单击播放按钮继续播放,在需要标注的画面中暂停,然后继续标注目标物体。界面右侧将呈现当前视频带标注的时间点。
-
修改标注
在界面右上角点击标签类别,可显示当前文件标签:
当数据完成标注后,您还可以进入“已标注”页签,删除标注数据。
- 单击目标编号操作列的,删除该段视频的标注。您也可以单击标注视频文件上方的叉号删除标注,然后单击“确认标注”。
在“已标注”页签下,单击目标视频文件,在标注页面右侧的**“当前文件标签”**下,可单击时间点右侧小三角展开详情,您可以修改或删除标签。
- 修改标签:单击标签右侧的编辑按钮,标签名称可进行修改。
- 删除标签:单击标签右侧的删除按钮,将直接删除此标签。如果单击画面时间右侧的删除按钮,将删除此画面下的所有标签。
发布数据集
标注完成后,可以发布版本,会将当前数据集数据存档。
数据集发布后,相关文件的目录结构说明:
由于数据集是基于OBS目录管理的,发布为新版本后,对应的数据集输出位置,也将基于新版本生成目录。
在数据集发布后,其相关文件的目录结构如下。
其manifest文件存放在此目录下:
标注结果文件(XML)为VOC格式,存放在数据集输出目录下:
|-- user-specified-output-path
|-- DatasetName-datasetId
|-- annotation
|-- VersionMame1
|-- VersionMame1.manifest
|-- annotations
|-- images
|-- videoName1
|-- videoName1.timestamp.xml
|-- videoName2
|-- videoName2.timestamp.xml
|-- VersionMame2
...
|-- ...
视频标注的关键帧存在数据集的输入目录下:
|-- user-specified-input-path
|-- images
|-- videoName1
|-- videoName1.timestamp.jpg
|-- videoName2
|-- videoName2.timestamp.jpg
参考:
【1】华为云ModelArts文档中心:https://support.huaweicloud.com/bestpractice-modelarts/modelarts_10_0018.html
【2】如何快速准备高质量的AI数据? https://bbs.huaweicloud.com/blogs/261979
【3】更多功能:https://bbs.huaweicloud.com/blogs/262413
【4】ModelArts产品地址:https://console.huaweicloud.com/modelarts/?region=cn-north-4#/dataset
- 点赞
- 收藏
- 关注作者
评论(0)