【昇腾】Snt9B服务器NPU驱动升级解决方案

举报
modelarts-dev-server 发表于 2023/11/24 18:16:01 2023/11/24
【摘要】 华为云NPU驱动固件包商用版本周期性的发布。 本文给出驱动固件新版本的升级方案。

1. 背景介绍

华为云NPU驱动固件包商用版本周期性的发布。 本文给出驱动固件新版本的升级方案。

场景是:从2023.07.15固件驱动版本,升级至2023.10.15固件驱动版本。

2.  驱动和固件包获取方法

驱动固件10.15商用版本软件包, 需要华为support官网申请下载:

地址: https://support.huawei.com/enterprise/zh/ascend-computing/ascend-hdk-pid-252764743/software/260867092?idAbsPath=fixnode01%7C23710424%7C251366513%7C22892968%7C252764743

选择对应版本方法:

(1)  版本及补丁软件->软件分类->910B-aarch64, 出现对应软件run包列表:

固件包: Ascend-hdk-910b-npu-firmware_6.4.0.4.220.run

驱动包:Ascend-hdk-910b-npu-driver_23.0.rc3_linux-aarch64.run

(2) 找到上方正确的软件包后,默认无权限下载,需要申请软件。 这部分请联系华为云ModelArts。

3.  驱动和固件包安装方法

笔者在华为云ModelArts弹性裸金属服务器.

局点: 贵阳一

服务器规格: physical.kat2ne.48xlarge.8.376t.ei.pod101

服务器镜像: 可以选择服务系统提供的各种镜像

固件和驱动安装时,注意安装顺序:

  • 首次安装场景:硬件设备刚出厂时未安装驱动,或者硬件设备前期安装过驱动固件但是当前已卸载,上述场景属于首次安装场景,需按照“驱动->固件”的顺序安装驱动固件。
  • 覆盖安装场景:硬件设备前期安装过驱动固件且未卸载,当前要再次安装驱动固件,此场景属于覆盖安装场景,需按照“固件->驱动”的顺序安装固件驱动。

下文假设驱动和固件已经被下载至服务器中.

3.1 安装驱动

执行以下命令,完成驱动安装。

./Ascend-hdk-910b-npu-driver_23.0.rc3_linux-aarch64.run --full --install-for-all --quiet

若执行上述安装命令出现类似如下回显信息,请参见安装驱动固件报错解决。

[ERROR]The list of missing tools: lspci,ifconfig,

若系统出现如下关键回显信息,则表示驱动安装成功。

Driver package installed successfully!

3.2 安装固件

执行以下命令,完成固件安装。

./Ascend-hdk-910b-npu-firmware_6.4.0.4.220.run –full --quiet

若系统出现如下关键回显信息,表示固件安装成功。

Firmware package installed successfully! Reboot now or after driver installation for the installation/upgrade to take effect

3.3 重启系统

执行reboot命令重启系统.

4.  验证方法

(1) 执行npu-smi info查看驱动加载是否成功。

若出现类似如下图所示回显信息,说明加载成功。否则,说明加载失败。请联系华为技术支持处理。

(2) 查看固件版本是否是目标版本

for i in ` seq 0 7`; do npu-smi info -t board -i $i; done | egrep -i "software|firmware"

回显结果会显示驱动和固件版本:查看是否与目标版本匹配即可。





【声明】本内容来自华为云开发者社区博主,不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。