华为云ModelArts再出发,视频数据也能轻松实现标注【玩转华为云】
前言
实际业务需求中,有一类功能较为棘手,那就是对视频数据的分析。
比如,日常的商品待补货、商品待整理、打折商品的标签补充等,目前都需要人工进行处理,耗时耗力,还可能出现不及时的情况。
如果机器拍摄货架视频,通过对视频的分析,自动生成上述功能的处理情况,可以节省人工检查的步骤,只需要做理货、补货、贴标签等工作。
这个模型对于我这类基础薄弱的开发者,还是比较难的。听说华为云ModelArts支持视频数据的智能标注,使用其预置算法,可以很方便的训练模型,且种类繁多,符合大部分场景。
接下来,我们来实操一个视频数据集的实验,感受一下华为云ModelArts的强大功能。
视频数据集实验
前置工作
- 首先确保已经完成了华为云账号的开通与认证。
- 创建OBS桶用于存储数据。
创建OBS桶的操作流程如下:
1、登录OBS管理控制台,在桶列表页面右上角单击“创建桶”,创建OBS桶。
2、完成参数录入,创建OBS桶。
- "区域":华北-北京四,后续区域需要选择和OBS桶一致。
- "桶名称":自行创建桶名称。
其他使用默认值即可。确认无误后单击右下角“立即创建”。
3、在桶列表页面,单击桶名称,进入该桶的概览页面。
4、单击概览页面的左侧导航的“对象”,在“对象”页面单击新建文件夹,创建OBS文件夹。
新建一个名为“traffic-in”的文件夹,存放数据集输入的数据。
新建一个名为“traffic-out”的文件夹,存放数据集输出的数据。
进入实验
步骤1:从AI Gallery下载数据集
1、进入模型详情页,下载数据集。
进入模型详情页有两种方式:
- 单击traffic,进入模型详情页。
- 单击AI Gallery链接,在“资产集市>数据”下,选择“数据集”,进入AI Gallery数据集页面,搜索“traffic”,进入模型详情页。
2、在弹出的下载页面中,设置目标区域和目标位置。
目标区域需与ModelArts使用区域一致。例如“华北-北京四”。
目标位置即指定数据集下载的目标路径,必须是OBS路径。选择之前创建的OBS路径。
3、单击“确定”开始下载。页面自动进入下载列表,可以通过进度列查看详细下载进度。
步骤2:创建视频数据集
1、进入ModelArts管理控制台,进入“数据管理>数据集”页面,单击“创建数据集”。
2、设置数据集相关参数:
- 标注类型:视频
- 数据集输入位置:设置为从AI Gallery中下载的目标位置。
- 数据集输出位置:在已有的OBS桶中,创建一个空目录作为输出路径。
其他参数建议使用默认值,然后单击“提交”,完成数据集创建。
步骤3:视频标注
1、在“数据管理>数据集”列表中,选择上述步骤中创建的数据集,单击"标注",进入标注任务创建页。
2、按照下图配置,完成创建。
3、在“数据管理>数据标注”列表中,选择上面新增的标注任务,单击名称,进入标注详情页。默认展示当前数据集中的所有数据,包含已标注和未标注视频。
4、选择一个数据,单击视频进入标注页面,在此页面,可进行标注操作。
5、视频暂停之后进行标注。
- 选择标注框。视频上方为标注栏,提供了与物体检测类似的标注框。提供了矩形、多边形、圆形、实线、虚线、点的标注。同一个数据集,请务必选择一种标注框进行标注。
- 标注视频中的物体。在视频下方,提供了视频暂停、播放、前进、后退等按钮操作,可供标注过程中,准确找到需要标注的画面。播放需标注的视频,当视频播放至待标注时间时,单击进度条中的暂停按钮,将视频暂停至某一画面。使用鼠标在视频画面中框出目标,然后在弹出的添加标签文本框中,直接输入新的标签名,在文本框前面选中标签颜色,单击“添加”完成1个物体的标注。如果已存在标签,从下拉列表中选择已有的标签,然后单击“添加”完成标注。逐步此画面中所有物体所在位置,一张画面可添加多个标签。上一个暂停画面标注完成后,在进度条处单击播放按钮继续播放,在需要标注的画面中暂停,然后继续标注目标物体。界面右侧将呈现当前视频带标注的时间点。
步骤4:发布数据集
1、返回列表页,单击列表上的“发布”。
2、在弹出的对话框中,默认预置了版本名称,从V001开始逐一递增。
设置版本名称。单击“确定”完成发布操作。
2、发布后,相关文件目录和文件格式说明。
由于数据集是基于OBS目录管理的,发布为新版本后,对应的数据集输出位置,也将基于新版本生成目录。
在数据集发布后,数据集将存储为manifest格式文件,manifest文件包含了数据及其标注信息,此文件的存放位置如下所示。
步骤5:后续操作
针对发布后的数据集,您可以订阅AI Gallery中的预置算法,也可自己开发算法,在ModelArts管理控制台中创建训练作业,得到模型。
总结
视频数据集的实验体验感觉是,流程简单便捷,没想到采用华为云ModelArts预置算法训练模型,是如此的便捷。
整个过程,相对困难的是视频标注的手动过程,需要逐帧去进行物体的标注。未来,我会继续探索智能标注的功能,提升效率。
接下来,我会实际业务场景中,带着华为云ModelArts的视频数据集带来的灵感,创造更好的实现方案。
未来,也期待与华为云ModelArts一起实现更多的可能。
作者:非职业「传道授业解惑」的开发者叶一一
简介:「趣学前端」、「CSS畅想」系列作者,华夏美食、国漫、古风重度爱好者,刑侦、无限流小说初级玩家。
如果看完文章有所收获,欢迎点赞👍 | 收藏⭐️ | 留言📝。
- 点赞
- 收藏
- 关注作者
评论(0)