[技术干货] TaiShan安装NVIDIA驱动后重启系统执行nvidia-smi报“NVIDIA_SMI has failed”错误解决方法

【问题描述】

TaiShan服务器安装NVIDIA驱动后执行nvidia-smi正常,但重启系统执行nvidia-smi报“NVIDIA_SMI has failed”错误,详细报错如下:

重新执行./NVIDIA-Linux-aarch64-460.73.01.run --no-install-libglvnd --kernel-source-path=/home/linux-5.4安装NVIDIA驱动时报错如下:

【解决方法】

1vim /etc/modprobe.d/blacklist.config

增加

blacklist nouveau


然后:wq!保存退出

2vim /etc/modprobe.d/blacklist-nouveau.config

增加

blacklist nouveau

options nouveau modest=0

然后:wq!保存退出

3、执行update-initramfs -u使其生效

4reboot重启系统

5、再次执行nvidis-smi即使用正确的NVIDIA驱动