虚拟机内部执行nvidia-smi报错(linux)
【摘要】 现象一虚拟机内部执行nvidia-smi报错:“NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.”一般是因为系统内核升级了,需要重新安装NVIDIA驱动 现...
现象一
虚拟机内部执行nvidia-smi报错:“NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.”

一般是因为系统内核升级了,需要重新安装NVIDIA驱动
现象二
执行nvidia-smi,单卡机器显示“No devices were found”或者 多卡机器上显示卡数目不全
如:

首先排查设备是否存在:lspci | grep –i nvidia
设备存在,执行nvidia-smi后查看虚拟机messages日志,有如下报错:

解决方法:重启虚拟机,重启之后执行nvidia-smi -pm 1(每次重启后都要执行一次)
【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区),文章链接,文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件至:cloudbbs@huaweicloud.com进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容。
- 点赞
- 收藏
- 关注作者
评论(0)