建议使用以下浏览器,以获得最佳体验。 IE 9.0+以上版本 Chrome 31+ 谷歌浏览器 Firefox 30+ 火狐浏览器
请选择 进入手机版 | 继续访问电脑版
设置昵称

在此一键设置昵称,即可参与社区互动!

确定
我再想想
选择版块
标签
您还可以添加5个标签
  • 没有搜索到和“关键字”相关的标签
  • 云产品
  • 解决方案
  • 技术领域
  • 通用技术
  • 平台功能
取消

Trible

发帖: 1粉丝: 0

级别 : 新手上路

发消息 + 关注

发表于2020年09月18日 18:32:00 269 5
直达本楼层的链接
楼主
显示全部楼层
[问题求助] ubuntu18.04在GPU训练cifar_resnet50.py

训练环境:

            Ubuntu18.04,

            MindSpore0.7.0-beta,

        GPU,

        python3.7.5


在使用Resnet50训练Cifar10数据集时,报如下错误,是什么原因?

image.png


举报
分享

分享文章到朋友圈

分享文章到微博

chengxiaoli

发帖: 52粉丝: 12

级别 : 版主

发消息 + 关注

发表于2020年09月18日 18:52:26
直达本楼层的链接
沙发
显示全部楼层

您好,您的问题已收录。我们会有技术专家帮您分析,会及时回复给您。

点赞 评论 引用 举报

Kakarotto

发帖: 0粉丝: 3

级别 : 版主

发消息 + 关注

发表于2020年09月19日 09:42:04
直达本楼层的链接
板凳
显示全部楼层

1. 看报错信息,这里是从python2.7加载起来的,你需要再确认下你的Python环境是否完全的符合 >=3.7.5。

image.png

2. 另外,你的训练命令:image.png,具体参数是啥?用的是 model_zoo里面提供的reset + cifar10 的训练脚本吗?因为看报错信息是找不到一个py文件。

评论
Trible 2020-9-21 09:29 评论

你好,我的环境时python3.7.5, 用的模型是从该地址下载的, https://gitee.com/mindspore/docs/tree/master/tutorials/tutorial_code/resnet

... 查看全部
点赞 评论 引用 举报

Trible

发帖: 1粉丝: 0

级别 : 新手上路

发消息 + 关注

发表于2020年09月21日 09:33:18
直达本楼层的链接
地板
显示全部楼层

用的参数是默认的 

image.png

点赞 评论 引用 举报

Kakarotto

发帖: 0粉丝: 3

级别 : 版主

发消息 + 关注

发表于2020年09月21日 10:49:16
直达本楼层的链接
5#
显示全部楼层

ops.... 我看到了这个脚本里,目前是只支持 Ascend 硬件的,没有看到对GPU支持。

image.png

你从哪个链接跳转到这个 https://gitee.com/mindspore/docs/tree/master/tutorials/tutorial_code/resnet 这个页面的?我们再确认下相关说明及脚本的支持范围。谢谢。


你可以进一步试下我们的model zoo中的脚本。

  1.  resnet在 https://gitee.com/mindspore/mindspore/blob/master/model_zoo/official/cv/resnet  目录下,这里有些详细说明及用法介绍。

  2. GPU多卡训练启动脚本为: https://gitee.com/mindspore/mindspore/blob/master/model_zoo/official/cv/resnet/scripts/run_distribute_train_gpu.sh

  3. GPU单卡训练启动脚本为: https://gitee.com/mindspore/mindspore/blob/master/model_zoo/official/cv/resnet/scripts/run_standalone_train_gpu.sh

点赞 评论 引用 举报

Trible

发帖: 1粉丝: 0

级别 : 新手上路

发消息 + 关注

发表于2020年09月21日 13:22:04
直达本楼层的链接
6#
显示全部楼层

我是从社区里面的一篇文章跳转的 https://bbs.huaweicloud.com/forum/thread-54069-1-1.html

我尝试了GPU单卡训练启动脚本后,又报错:

image.png

评论
Trible 2020-9-21 13:47 评论

用bash命令没有报错,但是没有出现训练的信息

... 查看全部
Kakarotto 2020-9-21 14:26 评论

评论 Trible:先配置下 export GLOG_v=1 ,再试下。这个是打开日志输出,INFO级别。

... 查看全部
Trible 2020-9-21 16:04 评论

试了一下,还是没有打印信息,但是看显卡内存是已经被占用着

... 查看全部
点赞 评论 引用 举报

游客

富文本
Markdown
您需要登录后才可以回帖 登录 | 立即注册