请问有什么办法可以解决GPU内存无限增大的问题?
在此一键设置昵称,即可参与社区互动!
发表于2021年03月27日 17:39:12
直达本楼层的链接
沙发
显示全部楼层
您好,欢迎使用MindSpore。 问题已经收到,正在联系专家分析,会尽快给您答复。 |
|
VGG16网络显存消耗挺大的,应该是显存不够了,缩小batchsize试试看,也可以缩小图片尺寸
评论
|
|
看日志报错是在图编译阶段,图编译阶段消耗的显存是不断增加的,图执行阶段每个step的显存消耗就基本不变。 可以把报错的日志再贴出来一些,从第一个ERROR或者WARNING开始 |
|
发表于2021年03月30日 09:55:19
直达本楼层的链接
8#
显示全部楼层
您好,初步看就是编译阶段的显存不足,编译阶段显存消耗是逐渐上升的。可以进一步确认下:
|
|
发表于2021年03月30日 16:43:07
直达本楼层的链接
9#
显示全部楼层
这是两个info文件
2021-3-30 16:42 上传 点击文件名下载附件
2021-3-30 16:42 上传 点击文件名下载附件 |
|
发表于2021年04月01日 16:27:27
直达本楼层的链接
11#
显示全部楼层
您好,这是四个文件,其中trainer.txt是主文件训练的,bay_loss和post_prob是用来计算损失函数的,utils.txt是结合loss和net等操作的,麻烦您帮忙看一下,谢谢。
2021-4-1 16:24 上传 点击文件名下载附件
2021-4-1 16:24 上传 点击文件名下载附件
2021-4-1 16:24 上传 点击文件名下载附件
2021-4-1 16:24 上传 点击文件名下载附件
评论
您好,新的问题在第二也页中有回复。https://bbs.huaweicloud.com/forum/thread-116835-2-1.html ... 查看全部 |
|
您发表的内容存在敏感词汇
如点击继续发布,文章中的敏感词将以*代替。
手机扫码分享给好友
您好,我的GPU-TITAN显存12G,训练的网络是VGG16.
... 查看全部