【昇腾】Snt9B服务器NPU驱动升级解决方案
1. 背景介绍
华为云NPU驱动固件包商用版本周期性的发布。 本文给出驱动固件新版本的升级方案。
场景是:从2023.07.15固件驱动版本,升级至2023.10.15固件驱动版本。
2. 驱动和固件包获取方法
驱动固件10.15商用版本软件包, 需要华为support官网申请下载:
选择对应版本方法:
(1) 版本及补丁软件->软件分类->910B-aarch64, 出现对应软件run包列表:
固件包: Ascend-hdk-910b-npu-firmware_6.4.0.4.220.run
驱动包:Ascend-hdk-910b-npu-driver_23.0.rc3_linux-aarch64.run
(2) 找到上方正确的软件包后,默认无权限下载,需要申请软件。 这部分请联系华为云ModelArts。
3. 驱动和固件包安装方法
笔者在华为云ModelArts弹性裸金属服务器.
局点: 贵阳一
服务器规格: physical.kat2ne.48xlarge.8.376t.ei.pod101
服务器镜像: 可以选择服务系统提供的各种镜像
固件和驱动安装时,注意安装顺序:
- 首次安装场景:硬件设备刚出厂时未安装驱动,或者硬件设备前期安装过驱动固件但是当前已卸载,上述场景属于首次安装场景,需按照“驱动->固件”的顺序安装驱动固件。
- 覆盖安装场景:硬件设备前期安装过驱动固件且未卸载,当前要再次安装驱动固件,此场景属于覆盖安装场景,需按照“固件->驱动”的顺序安装固件驱动。
下文假设驱动和固件已经被下载至服务器中.
3.1 安装驱动
执行以下命令,完成驱动安装。
./Ascend-hdk-910b-npu-driver_23.0.rc3_linux-aarch64.run --full --install-for-all --quiet
若执行上述安装命令出现类似如下回显信息,请参见安装驱动固件报错解决。
[ERROR]The list of missing tools: lspci,ifconfig,
若系统出现如下关键回显信息,则表示驱动安装成功。
Driver package installed successfully!
3.2 安装固件
执行以下命令,完成固件安装。
./Ascend-hdk-910b-npu-firmware_6.4.0.4.220.run –full --quiet
若系统出现如下关键回显信息,表示固件安装成功。
Firmware package installed successfully! Reboot now or after driver installation for the installation/upgrade to take effect
3.3 重启系统
执行reboot命令重启系统.
4. 验证方法
(1) 执行npu-smi info查看驱动加载是否成功。
若出现类似如下图所示回显信息,说明加载成功。否则,说明加载失败。请联系华为技术支持处理。
(2) 查看固件版本是否是目标版本
for i in ` seq 0 7`; do npu-smi info -t board -i $i; done | egrep -i "software|firmware"
回显结果会显示驱动和固件版本:查看是否与目标版本匹配即可。
- 点赞
- 收藏
- 关注作者
评论(0)