- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

华为云ModelArts再出发，视频数据也能轻松实现标注【玩转华为云】

叶一一发表于 2023/12/18 18:05:44 2023/12/18

【摘要】本篇主要分享视频数据集的实验，整个流程相对简单便捷，没想到采用华为云ModelArts预置算法训练模型，是如此的便捷。通过对于华为云ModelArts的一系列摸索，积累了大量的实验基础，未来我会继续探索智能标注的功能，提升效率。

前言

实际业务需求中，有一类功能较为棘手，那就是对视频数据的分析。

比如，日常的商品待补货、商品待整理、打折商品的标签补充等，目前都需要人工进行处理，耗时耗力，还可能出现不及时的情况。

如果机器拍摄货架视频，通过对视频的分析，自动生成上述功能的处理情况，可以节省人工检查的步骤，只需要做理货、补货、贴标签等工作。

这个模型对于我这类基础薄弱的开发者，还是比较难的。听说华为云ModelArts支持视频数据的智能标注，使用其预置算法，可以很方便的训练模型，且种类繁多，符合大部分场景。

接下来，我们来实操一个视频数据集的实验，感受一下华为云ModelArts的强大功能。

视频数据集实验

前置工作

首先确保已经完成了华为云账号的开通与认证。
创建OBS桶用于存储数据。

创建OBS桶的操作流程如下：

1、登录OBS管理控制台，在桶列表页面右上角单击“创建桶”，创建OBS桶。

2、完成参数录入，创建OBS桶。

"区域"：华北-北京四，后续区域需要选择和OBS桶一致。
"桶名称"：自行创建桶名称。

其他使用默认值即可。确认无误后单击右下角“立即创建”。

3、在桶列表页面，单击桶名称，进入该桶的概览页面。

4、单击概览页面的左侧导航的“对象”，在“对象”页面单击新建文件夹，创建OBS文件夹。

新建一个名为“traffic-in”的文件夹，存放数据集输入的数据。

新建一个名为“traffic-out”的文件夹，存放数据集输出的数据。

进入实验

步骤1：从AI Gallery下载数据集

1、进入模型详情页，下载数据集。

进入模型详情页有两种方式：

单击traffic，进入模型详情页。
单击AI Gallery链接，在“资产集市>数据”下，选择“数据集”，进入AI Gallery数据集页面，搜索“traffic”，进入模型详情页。

2、在弹出的下载页面中，设置目标区域和目标位置。

目标区域需与ModelArts使用区域一致。例如“华北-北京四”。

目标位置即指定数据集下载的目标路径，必须是OBS路径。选择之前创建的OBS路径。

3、单击“确定”开始下载。页面自动进入下载列表，可以通过进度列查看详细下载进度。

步骤2：创建视频数据集

1、进入ModelArts管理控制台，进入“数据管理>数据集”页面，单击“创建数据集”。

2、设置数据集相关参数：

标注类型：视频
数据集输入位置：设置为从AI Gallery中下载的目标位置。
数据集输出位置：在已有的OBS桶中，创建一个空目录作为输出路径。

其他参数建议使用默认值，然后单击“提交”，完成数据集创建。

步骤3：视频标注

1、在“数据管理>数据集”列表中，选择上述步骤中创建的数据集，单击"标注"，进入标注任务创建页。

2、按照下图配置，完成创建。

3、在“数据管理>数据标注”列表中，选择上面新增的标注任务，单击名称，进入标注详情页。默认展示当前数据集中的所有数据，包含已标注和未标注视频。

4、选择一个数据，单击视频进入标注页面，在此页面，可进行标注操作。

5、视频暂停之后进行标注。

选择标注框。视频上方为标注栏，提供了与物体检测类似的标注框。提供了矩形、多边形、圆形、实线、虚线、点的标注。同一个数据集，请务必选择一种标注框进行标注。
标注视频中的物体。在视频下方，提供了视频暂停、播放、前进、后退等按钮操作，可供标注过程中，准确找到需要标注的画面。播放需标注的视频，当视频播放至待标注时间时，单击进度条中的暂停按钮，将视频暂停至某一画面。使用鼠标在视频画面中框出目标，然后在弹出的添加标签文本框中，直接输入新的标签名，在文本框前面选中标签颜色，单击“添加”完成1个物体的标注。如果已存在标签，从下拉列表中选择已有的标签，然后单击“添加”完成标注。逐步此画面中所有物体所在位置，一张画面可添加多个标签。上一个暂停画面标注完成后，在进度条处单击播放按钮继续播放，在需要标注的画面中暂停，然后继续标注目标物体。界面右侧将呈现当前视频带标注的时间点。

步骤4：发布数据集

1、返回列表页，单击列表上的“发布”。

2、在弹出的对话框中，默认预置了版本名称，从V001开始逐一递增。

设置版本名称。单击“确定”完成发布操作。

2、发布后，相关文件目录和文件格式说明。

由于数据集是基于OBS目录管理的，发布为新版本后，对应的数据集输出位置，也将基于新版本生成目录。

在数据集发布后，数据集将存储为manifest格式文件，manifest文件包含了数据及其标注信息，此文件的存放位置如下所示。

步骤5：后续操作

针对发布后的数据集，您可以订阅AI Gallery中的预置算法，也可自己开发算法，在ModelArts管理控制台中创建训练作业，得到模型。

总结

视频数据集的实验体验感觉是，流程简单便捷，没想到采用华为云ModelArts预置算法训练模型，是如此的便捷。

整个过程，相对困难的是视频标注的手动过程，需要逐帧去进行物体的标注。未来，我会继续探索智能标注的功能，提升效率。

接下来，我会实际业务场景中，带着华为云ModelArts的视频数据集带来的灵感，创造更好的实现方案。

未来，也期待与华为云ModelArts一起实现更多的可能。

作者：非职业「传道授业解惑」的开发者叶一一
简介：「趣学前端」、「CSS畅想」系列作者，华夏美食、国漫、古风重度爱好者，刑侦、无限流小说初级玩家。
如果看完文章有所收获，欢迎点赞👍 | 收藏⭐️ | 留言📝。

【声明】本内容来自华为云开发者社区博主，不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源（华为云社区）、文章链接、文章作者等基本信息，否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@huaweicloud.com

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入