全部建议 > 建议详情
  • 预审中
  • 预审通过
  • 3 未采纳

【功能建议】ModelArts的NoteBook中训练时,CPU较差,影响GPU性能的发挥。 未采纳 编辑 删除

  • AI开发平台ModelArts
  • 其他
  • 对象存储服务 OBS
  • EI基础平台
  • 存储
  • 开发者
  • 运维

问题描述:

在使用NoteBook进行训练(因为调试方便,且能够运行,所以暂未选择训练作业,而是直接在NoteBook的JupyterLab执行训练),选用付费的V100训练,发现训练时CPU利用率为100%,右上角的CPU满格,为红色。而GPU的显存维持在8—9GB,利用率在不断变化,且是0—100%的上下浮动,这应该是CPU性能不够,不足以供得上GPU的使用而导致的。

当然,这可以通过调整batch size解决(本算法batch size为12),但调整batch size会对算法性能造成影响,且一般是爆显存时,才会降低,但这个显存占用远低于V100的32GB,所以感觉没必要,而且也是浪费资源,而付费的目前是有V100,并无P100可用,所以也无法选择以前便宜的P100了。

综上所示,感觉是CPU性能不太行。

同时也对比了,其他AI平台的同V100配置下的CPU配置,一般为16核,还有64核等配置,而华为云目前基本为8核(好像有时候是16核,感觉是在碰运气才会有,不是确定的)





建议方案:

优化性能,提升CPU性能,或换用更强的CPU,充分发挥V100的算力。

Tianyi_Li Tianyi_Li 发布于 2020-10-23 18:58:48 2020-10-23

123 1

100%
1人赞同
0%
0人不赞同

全部评论(1

评论(1

  • 【云声小管家】 思雨 2020-10-27 10:34:49

    非常感谢您的反馈,您的建议我们已经收到,并已提交至相关产品团队进行核查评估,评估完成后对于建议是否采纳会尽快给您答复,也请您持续关注云声平台,了解建议进一步处理进展,感谢您对华为云的支持!

登录后可评论,请 注册

0/1000

+ 插入图片0/4

仅支持JPG、JPEG、PNG、GIF,数量不超过4张且每张大小不超过2MB

评论
发表评论...
取消 发表

0/1000

评论成功

+ 插入图片0/4

仅支持JPG、JPEG、PNG、GIF,数量不超过4张且每张大小不超过2MB

删除建议

设置昵称

在此一键设置昵称,即可发表云声建议!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。