基于华为云ModelArts进行数据标注和数据切分 | 【玩转华为云】

举报
星恒 发表于 2022/03/29 21:25:58 2022/03/29
【摘要】 1、点击进入OBS对象存储服务2、点击右上角“创建桶”区域选择:华为-北京四填入桶名称:例如“data”数据冗余存储策略:选择单AZ存储其余配置默认即可,点击“立即创建”3、创建完成后,点击桶名称,然后点击“对象”4、点击“新建文件夹”,建立“data”,“out”两个文件夹5、点击数据集然后点击“点击下载”目标区域选择“华北-北京四”目标位置选择:刚才创建OBS数据桶路径,然后再选择刚才创...

1、点击进入OBS对象存储服务

2、点击右上角“创建桶”

区域选择:华为-北京四

填入桶名称:例如“data”

数据冗余存储策略:选择单AZ存储

其余配置默认即可,点击“立即创建”

3、创建完成后,点击桶名称,然后点击“对象”

4、点击“新建文件夹”,建立“data”,“out”两个文件夹

5、点击数据集

然后点击“点击下载”

目标区域选择“华北-北京四”

目标位置选择:刚才创建OBS数据桶路径,然后再选择刚才创建的data文件夹,如下图所示

等待下载完成即可

6、点击进入ModelArts平台

点击数据管理-数据集,然后点击创建数据集

标注场景选择图片

标注类型选择物体检测

数据集输入位置选择创建的OBS桶中的data文件夹路径

数据集输出位置选择创建的OBS桶中的out文件夹路径

其余的配置默认,然后点击创建

7、点击数据集名称进入

可以看见数据集中有未标注的数据,点击开始标注进入数据标注界面

点击“未标注”,然后点击图片

对目标进行框选(画矩形框的方式是先点击选择矩形的左上角,然后再点击选择矩形的右下角),然后选择对应的标签,完成后点击右上角“下一张”,会自动保存标注

8、在数据量特别大的时候,物体检测任务的标注工作量很大,并且枯燥无味,我们可以借助ModelArts平台的智能标注功能来解决这个问题

点击“返回数据标注预览”

点击右上角“启动智能标注”

选择“主动学习”,点击确认(关于快速性和精准性可以自主选择,精准性的准确度高但是时间更长)

智能标注完成后,完成智能标注的图片会进入待确认状态,点击图片可以对标注进行校对确认

在实际应用场景中,智能标注是一个迭代的过程,每一轮只确认部分数据,然后继续启动下一轮智能标注,这样会使得智能标注的结果越标越准。在数据量巨大的数据集中,迭代进行数据标注是一种重要的方法。

9、所有数据标注完成后,左上角点击“返回数据集概览”,然后在新的界面的右上角点击“发布”

根据模型训练需要,确认是否对数据集进行切分,如果需要,输入训练集和验证集的比例,点击确认即可完成对数据集的划分

发布成功后,发布好的数据集可以在ModelArts上训练模型的时候使用。

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。