- 预审中
- 预审通过
- 3 未采纳
【功能建议】ModelArts中AI市场中新开放的数据集功能能否发布一些常用数据集 未采纳 编辑 删除
- AI开发平台ModelArts
- 开发者
- 对象存储服务 OBS
- EI基础平台
- 存储
问题描述:
数据集作为人工智能的三驾马车之一,是非常重要的,华为云ModelArts推出的数据集功能还是很棒的。但是目前数据集功能未能得到很好的发挥,数据集的开源共享的特性未能得到发挥。目前数据集只有官方发布的几个较为简单的数据集,常用的COCO数据集、部分ImageNet数据集以及一些常见的数据集等数据集未能出现,这些数据集较大,适合做训练,但自己上传比较耗费时间和Money,在OBS中存储和调用花费不少,不利于开发者使用。
昨天(2020年7月19日)使用OBS客户端上传了约19GB的数据集,以用于模型训练,上传了约一天,仍未能上传完成,速度降到了几百KB/s(应该不是我本地网速的问题),比较耗费时间。
建议方案:
希望官方能发布一些常用的较大的数据集,比如COCO数据集等,甚至一些AI市场官方发布的算法训练时得到预训练模型的数据集,这些都有助于开发者更好的在ModelArts上开发实现自己的算法。
比如百度的AI Studio就有类似的数据集分享,由官方和第三方开发者共同维护,官方和第三方开发者都发布了不少较好的常用数据集,并可以直接在AI Studio中的NoteBook中直接调用,就像在本地用Jupyter NoteBook一样。
我想官方在训练发布到AI市场的算法时,会用到不少数据集,这些数据集应该也是存储在OBS桶中,而且应该其中有一些是公开数据集,如果能够分享出来,通过AI市场的数据集分享给更多开发者,相信一定有助于开发者使用ModelArts,建设良好生态。
这也会减少开发者上传数据集的时间,降低他们的存储成本,利于开发。
Tianyi_Li
发布于 2020-07-20 09:39:48
2020-07-20
87 1
0/1000
仅支持JPG、JPEG、PNG、GIF,数量不超过4张且每张大小不超过2MB
删除建议
全部评论(1)
评论(1)
非常感谢您的反馈,您的建议我们已经收到,并已提交至相关产品团队进行核查评估,评估完成后对于建议是否采纳会尽快给您答复,也请您持续关注云声平台,了解建议进一步处理进展,感谢您对华为云的支持!