基于华为云ModelArts进行数据标注和数据切分 | 【玩转华为云】
【摘要】 1、点击进入OBS对象存储服务2、点击右上角“创建桶”区域选择:华为-北京四填入桶名称:例如“data”数据冗余存储策略:选择单AZ存储其余配置默认即可,点击“立即创建”3、创建完成后,点击桶名称,然后点击“对象”4、点击“新建文件夹”,建立“data”,“out”两个文件夹5、点击数据集然后点击“点击下载”目标区域选择“华北-北京四”目标位置选择:刚才创建OBS数据桶路径,然后再选择刚才创...
1、点击进入OBS对象存储服务
2、点击右上角“创建桶”
区域选择:华为-北京四
填入桶名称:例如“data”
数据冗余存储策略:选择单AZ存储
其余配置默认即可,点击“立即创建”
3、创建完成后,点击桶名称,然后点击“对象”
4、点击“新建文件夹”,建立“data”,“out”两个文件夹
5、点击数据集
然后点击“点击下载”
目标区域选择“华北-北京四”
目标位置选择:刚才创建OBS数据桶路径,然后再选择刚才创建的data文件夹,如下图所示
等待下载完成即可
6、点击进入ModelArts平台
点击数据管理-数据集,然后点击创建数据集
标注场景选择图片
标注类型选择物体检测
数据集输入位置选择创建的OBS桶中的data文件夹路径
数据集输出位置选择创建的OBS桶中的out文件夹路径
其余的配置默认,然后点击创建
7、点击数据集名称进入
可以看见数据集中有未标注的数据,点击开始标注进入数据标注界面
点击“未标注”,然后点击图片
对目标进行框选(画矩形框的方式是先点击选择矩形的左上角,然后再点击选择矩形的右下角),然后选择对应的标签,完成后点击右上角“下一张”,会自动保存标注
8、在数据量特别大的时候,物体检测任务的标注工作量很大,并且枯燥无味,我们可以借助ModelArts平台的智能标注功能来解决这个问题
点击“返回数据标注预览”
点击右上角“启动智能标注”
选择“主动学习”,点击确认(关于快速性和精准性可以自主选择,精准性的准确度高但是时间更长)
智能标注完成后,完成智能标注的图片会进入待确认状态,点击图片可以对标注进行校对确认
在实际应用场景中,智能标注是一个迭代的过程,每一轮只确认部分数据,然后继续启动下一轮智能标注,这样会使得智能标注的结果越标越准。在数据量巨大的数据集中,迭代进行数据标注是一种重要的方法。
9、所有数据标注完成后,左上角点击“返回数据集概览”,然后在新的界面的右上角点击“发布”
根据模型训练需要,确认是否对数据集进行切分,如果需要,输入训练集和验证集的比例,点击确认即可完成对数据集的划分
发布成功后,发布好的数据集可以在ModelArts上训练模型的时候使用。
【声明】本内容来自华为云开发者社区博主,不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
作者其他文章
评论(0)