基于华为云ModelArts进行数据标注和数据切分 | 【玩转华为云】
1、点击进入OBS对象存储服务
2、点击右上角“创建桶”
区域选择:华为-北京四
填入桶名称:例如“data”
数据冗余存储策略:选择单AZ存储
其余配置默认即可,点击“立即创建”
3、创建完成后,点击桶名称,然后点击“对象”
4、点击“新建文件夹”,建立“data”,“out”两个文件夹
5、点击数据集
然后点击“点击下载”
目标区域选择“华北-北京四”
目标位置选择:刚才创建OBS数据桶路径,然后再选择刚才创建的data文件夹,如下图所示
等待下载完成即可
6、点击进入ModelArts平台
点击数据管理-数据集,然后点击创建数据集
标注场景选择图片
标注类型选择物体检测
数据集输入位置选择创建的OBS桶中的data文件夹路径
数据集输出位置选择创建的OBS桶中的out文件夹路径
其余的配置默认,然后点击创建
7、点击数据集名称进入
可以看见数据集中有未标注的数据,点击开始标注进入数据标注界面
点击“未标注”,然后点击图片
对目标进行框选(画矩形框的方式是先点击选择矩形的左上角,然后再点击选择矩形的右下角),然后选择对应的标签,完成后点击右上角“下一张”,会自动保存标注
8、在数据量特别大的时候,物体检测任务的标注工作量很大,并且枯燥无味,我们可以借助ModelArts平台的智能标注功能来解决这个问题
点击“返回数据标注预览”
点击右上角“启动智能标注”
选择“主动学习”,点击确认(关于快速性和精准性可以自主选择,精准性的准确度高但是时间更长)
智能标注完成后,完成智能标注的图片会进入待确认状态,点击图片可以对标注进行校对确认
在实际应用场景中,智能标注是一个迭代的过程,每一轮只确认部分数据,然后继续启动下一轮智能标注,这样会使得智能标注的结果越标越准。在数据量巨大的数据集中,迭代进行数据标注是一种重要的方法。
9、所有数据标注完成后,左上角点击“返回数据集概览”,然后在新的界面的右上角点击“发布”
根据模型训练需要,确认是否对数据集进行切分,如果需要,输入训练集和验证集的比例,点击确认即可完成对数据集的划分
发布成功后,发布好的数据集可以在ModelArts上训练模型的时候使用。
- 点赞
- 收藏
- 关注作者
评论(0)