全部建议 > 建议详情
  • 预审中
  • 预审通过
  • 3 未采纳

【功能建议】ModelArts中AI市场中新开放的数据集功能能否发布一些常用数据集 未采纳 编辑 删除

  • AI开发平台ModelArts
  • 开发者
  • 对象存储服务 OBS
  • EI基础平台
  • 存储

问题描述:

数据集作为人工智能的三驾马车之一,是非常重要的,华为云ModelArts推出的数据集功能还是很棒的。但是目前数据集功能未能得到很好的发挥,数据集的开源共享的特性未能得到发挥。目前数据集只有官方发布的几个较为简单的数据集,常用的COCO数据集、部分ImageNet数据集以及一些常见的数据集等数据集未能出现,这些数据集较大,适合做训练,但自己上传比较耗费时间和Money,在OBS中存储和调用花费不少,不利于开发者使用。

昨天(2020年7月19日)使用OBS客户端上传了约19GB的数据集,以用于模型训练,上传了约一天,仍未能上传完成,速度降到了几百KB/s(应该不是我本地网速的问题),比较耗费时间。





建议方案:

  1. 希望官方能发布一些常用的较大的数据集,比如COCO数据集等,甚至一些AI市场官方发布的算法训练时得到预训练模型的数据集,这些都有助于开发者更好的在ModelArts上开发实现自己的算法。

    比如百度的AI Studio就有类似的数据集分享,由官方和第三方开发者共同维护,官方和第三方开发者都发布了不少较好的常用数据集,并可以直接在AI Studio中的NoteBook中直接调用,就像在本地用Jupyter NoteBook一样。

  2. 我想官方在训练发布到AI市场的算法时,会用到不少数据集,这些数据集应该也是存储在OBS桶中,而且应该其中有一些是公开数据集,如果能够分享出来,通过AI市场的数据集分享给更多开发者,相信一定有助于开发者使用ModelArts,建设良好生态。

  3. 这也会减少开发者上传数据集的时间,降低他们的存储成本,利于开发。

Tianyi_Li Tianyi_Li 发布于 2020-07-20 09:39:48 2020-07-20

87 1

0%
0人赞同
0%
0人不赞同

全部评论(1

评论(1

  • 【云声小管家】 思雨 2020-07-20 15:47:06

    非常感谢您的反馈,您的建议我们已经收到,并已提交至相关产品团队进行核查评估,评估完成后对于建议是否采纳会尽快给您答复,也请您持续关注云声平台,了解建议进一步处理进展,感谢您对华为云的支持!

登录后可评论,请 注册

0/1000

+ 插入图片0/4

仅支持JPG、JPEG、PNG、GIF,数量不超过4张且每张大小不超过2MB

评论
发表评论...
取消 发表

0/1000

评论成功

+ 插入图片0/4

仅支持JPG、JPEG、PNG、GIF,数量不超过4张且每张大小不超过2MB

删除建议

设置昵称

在此一键设置昵称,即可发表云声建议!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。