【ModelArts入门指南】手把手教你在ModelArts进行图像标注
如同电影中描绘的未来世界,AI成为社会发展不可或缺的生产力。当今AI的触角已经延伸至各行各业,虽然还远未达到电影中的理想状态,但是星星之火可以燎原的势态已经展现。AI开发是一个涉及数据准备,模型训练,服务部署等多步骤协调统筹的过程,对于大型企业级AI开发,涉及众多开发模块相互配合,一个全流程AI开发管理系统必不可少,ModelArts作为一站式AI开发平台,立足开发者,理解开发者痛点,提供智能,开放及友好的AI开发全流程管理能力。非常推荐广大AI开发者使用,享受ModelArts进行AI开发的乐趣和快感。
ModelArts作为国内领先的AI开发平台,提供了完备的数据全流程管理能力,涉及数据预览,校验,自动分组及10+的标注工具。同时提供智能标注和团队标注,提升大规模数据标注及处理能力。ModelArts有着如此强大的数据管理能力,当然需要让更多的AI开发者了解ModelArts的强大。这篇文档主要基于数据管理标注工具,给大家指导如何在ModelArts进行图片标注。
数据准备
首先需要上传待标注图片至OBS桶,OBS是华为云对象存储服务,提供强大的数据存储能力。本文主要涉及待标注图片的上传和标注结果的保存,可以直接按照如下步骤进行OBS操作:
点击链接访问OBS管理页面,如截图1所示,点击【创建桶】按钮。
如截图2所示为OBS桶创建页面,需要关注[区域]和[桶名称]即可。区域表示当前桶创建在哪个region,在此处指定region以后,ModelArts进行数据标注也需要切换至对应的region,否则无法找到上传待标注图片数据。桶名称自行填写,其他可以保持默认,直接点击【立刻创建】按钮。
OBS桶创建完成,页面自动跳转至OBS桶列表页面,如截图3所示,点击刚才创建的桶名,进入桶详情页面。
如截图4所示为桶详情页面,点击左侧菜单【对象】按钮,即可查看或者上传当前桶下的管理数据。
点击【对象】按钮进入对象列表页面,进行文件夹创建和标注数据上传,如截图5所示进行文件夹创建。
然后点击创建文件夹名称进入新创建文件夹,如截图6所示进行数据上传。
如截图7所示即表示新创建文件夹下数据上传完成,数据准备工作结束。
创建数据集
点击链接进入ModelArts数据管理页面,进入页面以后注意查看控制台region和准备工作章节创建桶选中的region是否一致。如不一致点击下拉框选中OBS桶所在region,如截图8所示,然后点击【创建数据集】进行数据集创建。
如截图9所示,在创建数据集页面可以进行标注类型的选择,图片类型数据支持图像分类,物体检测和图像分割三种,因为图像分割类型和物体检测标注操作比较类似,所以本文只演示图像分类和物体检测两种类型。
创建页面还存在【数据集输入位置】,【数据集输出位置】及【添加标签集】三个配置项,输入位置表示待标注图片的OBS存放位置,输出位置表示标注结果的OBS存放位置,标签集是可选输入项,如果在启动标注之前已知当前图片存在的标签,可以在创建阶段直接填写,如果未知也支持标注阶段进行标签添加。配置信息如截图10所示。
在配置数据集输出位置时,需要创建文件夹,ModelArts 提供了OBS文件夹创建的快捷操作,点击截图10所示图标,展示数据集输出位置选择弹窗,如截图11所示,选择【新建文件夹】按钮并填入输出路径名称dataset_output即可。
如上所述在创建页面选择标注类型,配置输入位置,输出位置和标签集添加,点击【创建】按钮完成数据集创建,页面会自动跳转至数据集列表,如截图12所示。对应不同标注类型,点击新创建数据集名称会跳转至不同标注页面,对应标注方式也不同。接下来按照图像分类和物体检测两种类型进行操作介绍。
图像分类标注
点击图像分类数据集名称,进入数据集概览页面,如截图13所示,可以看到概览页面提供了标注进展,标签统计,版本管理和数据特性分析等功能,这些功能可以让用户从多个维度度量当前数据集及标注任务的质量及进展。本文不涉及这些高阶功能的介绍,读者如果感兴趣,可以进行试用,继续探索ModelArts丰富的数据管理能力。
点击数据集概览页面右上角【开始标注】按钮,进入待标注图片列表页面并启动标注。如截图14所示,首次进入该页面,会进行标注步骤说明,指导用户如何进行标注。
按照标注样例说明,我们首先选中标注图片,鼠标移动到待标注图片显示区域,会出现图片勾选框,如截图15所示。选中一张待标注图片,其他待标注图片也会进入选中状态,按需选择标注图片即可,或者进行当前页所有图片的选择。
选中图片以后,在页面右上角区域,进行标签添加,如截图16所示。鼠标点击标签名输入框,自动联想当前数据集所有标签列表,选中当前图片对应标签,然后点击【确认】按钮即可完成标注。
标注完成以后,已标注图片会刷新至已标注页签,如截图17所示,继续进行其他未标注图片标注。图像分类标注任务即可完成。
如果需要标签修改或者删除,也可以直接选中图片,在页面右上角标签列表进行修改删除,如截图18所示。
物体检测标注
参照【创建数据集】章节,继续创建物体检测类型数据集并进入图片列表页面,和图像分类标注不同,物体检测标注不需要进行图片勾选,直接点击待标注图片,进入图片标注页面。如截图19所示,首次进入该页面。同样会显示标注样例说明。
参照指导说明,进行标注框标注,当鼠标移动至图片显示区域时,可以看到有如下提示[左击进行绘制,右击取消绘制状态],如截图20所示。
首先鼠标左击,选中标注框开始位置,标注框开始跟随鼠标进行绘制,观察标注框是否已到达预期位置,再次鼠标左击,标注框绘制完成,页面自动弹出标签添加弹窗,选中对应标签点击【添加】按钮进行添加,如截图21所示。
如截图22所示,完成当前图片物体检测标注框的添加。点击页面下方其他缩略图进行图片切换,继续进行标注。
完成图片标注以后,返回图片列表页面,可以看到当前所有已标注图片的标注信息,如截图23所示。至此物体检测的标注任务已经完成。
完成上述图像分类和物体检测标注以后,标注结果可以在创建数据集选中的输出位置中查看。同时也支持标注结果的导出和版本发布,供后续训练使用。
高阶功能说明
本文只介绍了ModelArts服务图像标注的基本功能。从文中截图可以看到,数据管理还提供了很多其他高级功能,比如智能标注,自动分组,多维筛选及团队标注,这些功能给使用者提供了完备的数据管理及标注能力,极大程度提升了AI开发过程中的数据准备,处理和管理效率。这些功能不在本文详细说明。留给读者继续探索。ModelArts一站式AI开发平台,欢迎大家使用并提供宝贵建议~
- 点赞
- 收藏
- 关注作者
评论(0)