华为云ModelArts再出发,视频数据也能轻松实现标注【玩转华为云】

举报
叶一一 发表于 2023/12/18 18:05:44 2023/12/18
【摘要】 本篇主要分享视频数据集的实验,整个流程相对简单便捷,没想到采用华为云ModelArts预置算法训练模型,是如此的便捷。通过对于华为云ModelArts的一系列摸索,积累了大量的实验基础,未来我会继续探索智能标注的功能,提升效率。

前言

实际业务需求中,有一类功能较为棘手,那就是对视频数据的分析。

比如,日常的商品待补货、商品待整理、打折商品的标签补充等,目前都需要人工进行处理,耗时耗力,还可能出现不及时的情况。

如果机器拍摄货架视频,通过对视频的分析,自动生成上述功能的处理情况,可以节省人工检查的步骤,只需要做理货、补货、贴标签等工作。

这个模型对于我这类基础薄弱的开发者,还是比较难的。听说华为云ModelArts支持视频数据的智能标注,使用其预置算法,可以很方便的训练模型,且种类繁多,符合大部分场景。

接下来,我们来实操一个视频数据集的实验,感受一下华为云ModelArts的强大功能。

视频数据集实验

前置工作

  • 首先确保已经完成了华为云账号的开通与认证。
  • 创建OBS桶用于存储数据。

创建OBS桶的操作流程如下:

1、登录OBS管理控制台,在桶列表页面右上角单击“创建桶”,创建OBS桶。

2、完成参数录入,创建OBS桶。

    • "区域":华北-北京四,后续区域需要选择和OBS桶一致。
    • "桶名称":自行创建桶名称。

其他使用默认值即可。确认无误后单击右下角“立即创建”。

3、在桶列表页面,单击桶名称,进入该桶的概览页面。

4、单击概览页面的左侧导航的“对象”,在“对象”页面单击新建文件夹,创建OBS文件夹。

新建一个名为“traffic-in”的文件夹,存放数据集输入的数据。

新建一个名为“traffic-out”的文件夹,存放数据集输出的数据。

进入实验

步骤1:从AI Gallery下载数据集

1、进入模型详情页,下载数据集。

进入模型详情页有两种方式:

  • 单击traffic,进入模型详情页。
  • 单击AI Gallery链接,在“资产集市>数据”下,选择“数据集”,进入AI Gallery数据集页面,搜索“traffic”,进入模型详情页。

2、在弹出的下载页面中,设置目标区域目标位置

目标区域需与ModelArts使用区域一致。例如“华北-北京四”。

目标位置即指定数据集下载的目标路径,必须是OBS路径。选择之前创建的OBS路径。

3、单击“确定”开始下载。页面自动进入下载列表,可以通过进度列查看详细下载进度。

步骤2:创建视频数据集

1、进入ModelArts管理控制台,进入“数据管理>数据集”页面,单击“创建数据集”。

2、设置数据集相关参数:

  • 标注类型:视频
  • 数据集输入位置:设置为从AI Gallery中下载的目标位置。
  • 数据集输出位置:在已有的OBS桶中,创建一个空目录作为输出路径。

其他参数建议使用默认值,然后单击“提交”,完成数据集创建。

步骤3:视频标注

1、在“数据管理>数据集”列表中,选择上述步骤中创建的数据集,单击"标注",进入标注任务创建页。

2、按照下图配置,完成创建。

3、在“数据管理>数据标注”列表中,选择上面新增的标注任务,单击名称,进入标注详情页。默认展示当前数据集中的所有数据,包含已标注未标注视频。

4、选择一个数据,单击视频进入标注页面,在此页面,可进行标注操作。

5、视频暂停之后进行标注。

  1. 选择标注框。视频上方为标注栏,提供了与物体检测类似的标注框。提供了矩形、多边形、圆形、实线、虚线、点的标注。同一个数据集,请务必选择一种标注框进行标注。
  2. 标注视频中的物体。在视频下方,提供了视频暂停、播放、前进、后退等按钮操作,可供标注过程中,准确找到需要标注的画面。播放需标注的视频,当视频播放至待标注时间时,单击进度条中的暂停按钮,将视频暂停至某一画面。使用鼠标在视频画面中框出目标,然后在弹出的添加标签文本框中,直接输入新的标签名,在文本框前面选中标签颜色,单击“添加”完成1个物体的标注。如果已存在标签,从下拉列表中选择已有的标签,然后单击“添加”完成标注。逐步此画面中所有物体所在位置,一张画面可添加多个标签。上一个暂停画面标注完成后,在进度条处单击播放按钮继续播放,在需要标注的画面中暂停,然后继续标注目标物体。界面右侧将呈现当前视频带标注的时间点。

步骤4:发布数据集

1、返回列表页,单击列表上的“发布”。

2、在弹出的对话框中,默认预置了版本名称,从V001开始逐一递增。

设置版本名称。单击“确定”完成发布操作。

2、发布后,相关文件目录和文件格式说明。

由于数据集是基于OBS目录管理的,发布为新版本后,对应的数据集输出位置,也将基于新版本生成目录。

在数据集发布后,数据集将存储为manifest格式文件,manifest文件包含了数据及其标注信息,此文件的存放位置如下所示。

步骤5:后续操作

针对发布后的数据集,您可以订阅AI Gallery中的预置算法,也可自己开发算法,在ModelArts管理控制台中创建训练作业,得到模型。

总结

视频数据集的实验体验感觉是,流程简单便捷,没想到采用华为云ModelArts预置算法训练模型,是如此的便捷。

整个过程,相对困难的是视频标注的手动过程,需要逐帧去进行物体的标注。未来,我会继续探索智能标注的功能,提升效率。

接下来,我会实际业务场景中,带着华为云ModelArts的视频数据集带来的灵感,创造更好的实现方案。

未来,也期待与华为云ModelArts一起实现更多的可能。


作者:非职业「传道授业解惑」的开发者叶一一
简介:「趣学前端」、「CSS畅想」系列作者,华夏美食、国漫、古风重度爱好者,刑侦、无限流小说初级玩家。
如果看完文章有所收获,欢迎点赞👍 | 收藏️ | 留言📝

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。