[昇腾]Atlas800(鲲鹏920+昇腾Snt9处理器)环境配置指导

举报
modelarts-dev-server 发表于 2023/06/20 15:34:55 2023/06/20
【摘要】 华为云Snt9裸金属服务器装机指南

1. 环境描述

服务器信息: 华为云Snt9裸金属服务器

操作系统: Euler2.8

本文安装环境相关操作: 升级预置的C78固件和驱动到C86(6.3.RC2) 、配置磁盘、安装docker、配置源

2. ASCEND环境安装指南

2.1 磁盘合并挂载

首次配置环境时,需要先处理磁盘分配,这样可以把机器上的SSD盘空间用起来。这一步操作放在最开始,避免使用一段时间再挂载容易冲掉用户已存储的内容。

首先通过df -h查看是否已经有几个T的存储空间,如果有代表已挂载过,可跳过此章节,只用直接在/home目录下创建自己的个人开发目录即可。

执行挂载操作,查看系统存储信息(fdisk -l),可以看到有三块nvme SSD硬盘/dev/nvme0n1、/dev/nvme1n1、/dev/nvme2n1

我们将/dev/nvme0n1挂载在/home下供每人创建自己的家目录,另两个合并挂载到/docker下供容器使用,如果不单独给docker分配较大空间,当多人共用时起多个容器很容易将根目录撑满。

#  第一块盘给用户存数据用
mkfs -t xfs /dev/nvme0n1
mkdir -p /data/home
mv /home/* /data/home/
mount /dev/nvme0n1 /home
mv /data/home/* /home/
rm -rf  /data/home
cd /home
mkdir -p  个人目录名

#  后两块盘给docker容器使用,多块盘合并成一个文件系统目录需要涉及pv/vg/lv,了解概念可参考:https://www.linuxidc.com/Linux/2017-05/143724.htm
#  创建pv(物理卷 physical volume 基本存储逻辑块)
pvcreate /dev/nvme1n1
pvcreate /dev/nvme2n1
#  创建vg(卷组 Volume Group 这里将两块pv组成一个组)
vgcreate nvme_group  /dev/nvme1n1 /dev/nvme2n1
#  创建lv(逻辑卷 logical volume  可以在组里划分逻辑存储,每个lv可对应文件系统比如/home或者/usr等,这里将100%的VG空间都给这个lv)
lvcreate -l 100%VG -n docker_data nvme_group
#  格式化分区
mkfs -t xfs /dev/nvme_group/docker_data
#  挂载到/docker目录
mkdir /docker
mount /dev/nvme_group/docker_data /docker

查看UUID:

blkid /dev/nvme_group/docker_data
blkid /dev/nvme0n1

设置开机启动自动挂载:

vim /etc/fstab  
#  文件末尾一行填写以下内容:
UUID=上一步查询出的UUID值1   /docker xfs defaults 0 0
UUID=上一步查询出的UUID值2  /home xfs defaults 0 0

执行如下命令检测配置文件正确性:

mount -a

如果没有错误输出则代表配置正确,这里务必保证配置正确,如果配置错误会导致机器重启时无法正常启动。

配置完成后,执行df -h可以看到新挂载的盘信息。

2.2 固件和驱动升级

首先查看当前拿到的机器的固件和驱动版本:

for i in `seq 0 7`; do npu-smi info -t board -i $i; done | egrep -i "software|firmware"

输出结果如下:

其中firmware代表固件版本,software代表驱动版本,当前910机器购买后预装的版本不是最新的发布版本,建议升级固件驱动版本到最新版本

下载固件和驱动包

区域:乌兰察布一

# 下载固件包 (当前商用发布的最新版)
wget  https://cn-north-9-rse.obs.cn-north-9.myhuaweicloud.com/drivers/Ascend-hdk-910-npu-firmware_6.4.12.1.241.run
# 下载驱动包 (当前商用发布的最新版)
wget  https://cn-north-9-rse.obs.cn-north-9.myhuaweicloud.com/drivers/Ascend-hdk-910-npu-driver_23.0.rc2_linux-aarch64.run

升级固件

chmod 700 *.run
bash Ascend-hdk-910-npu-firmware_6.4.12.1.241.run --full
# 升级完成后需要重启
reboot

升级驱动,提示处输入“y”,

bash Ascend-hdk-910-npu-driver_23.0.rc2_linux-aarch64.run --full
# 根据提示执行reboot
reboot

重启执行成功后,通过下述命令,查看当前固件和驱动版本

for i in `seq 0 7`; do npu-smi info -t board -i $i; done | egrep -i "software|firmware"

输出版本号如下则表示升级成功:

2.3 安装docker

如果有使用docker的需求,可以按照如下指导安装docker

1. 下载二进制包

官方下载地址:https://download.docker.com/linux/static/stable/aarch64/

尽量选用比较新的稳定版本,本样例以20.10.9为例

wget https://download.docker.com/linux/static/stable/aarch64/docker-20.10.9.tgz

准备脚本:vi docker.service  填入以下内容

[Unit]
Description=Docker Application Container Engine
Documentation=https://docs.docker.com
After=network-online.target firewalld.service
Wants=network-online.target

[Service]
Type=notify
EnvironmentFile=-/etc/sysconfig/docker
EnvironmentFile=-/etc/sysconfig/docker-storage
EnvironmentFile=-/etc/sysconfig/docker-network
Environment=GOTRACEBACK=crash

ExecStart=/usr/bin/dockerd $OPTIONS \
                           $DOCKER_STORAGE_OPTIONS \
                           $DOCKER_NETWORK_OPTIONS \
                           $INSECURE_REGISTRY
ExecReload=/bin/kill -s HUP $MAINPID
LimitNOFILE=1048576
LimitNPROC=1048576
LimitCORE=infinity
# set delegate yes so that systemd does not reset the cgroups of docker containers
Delegate=yes
# kill only the docker process, not all processes in the cgroup
KillMode=process

[Install]
WantedBy=multi-user.target

安装脚本 vi  install.sh 填入以下内容

#!/bin/sh
echo '解压tar包...'
tar -zxf $1

echo '将docker目录移到/usr/bin目录下...'
cp -af docker/* /usr/bin/

echo '将docker.service 移到/etc/systemd/system/ 目录...'
cp –af docker.service /etc/systemd/system/

echo '添加文件权限...'
chmod +x /etc/systemd/system/docker.service

echo '重新加载配置文件...'
systemctl daemon-reload

echo '启动docker...'
systemctl start docker

echo '设置开机自启...'
systemctl enable docker.service

echo 'docker安装成功.'

执行脚本进行安装,包名根据具体下载的版本替换:

chmod 700 install.sh
sh install.sh docker-20.10.9.tgz

查看版本信息,正常输出表示安装成功

docker version

配置IP转发,用于容器内的网络访问:

vi /etc/sysctl.conf
#  修改/etc/sysctl.conf 系统配置,修改此项值为1
net.ipv4.ip_forward = 1
#  从文件读取配置
sysctl -p

点击链接下载社区版Ascend docker runtime,这个包是昇腾开发的docker插件,在docker run时可以自动挂载昇腾driver等路径到容器。下载好后将包上传到服务器并进行安装:

chmod 700 *.run
./Ascend-docker-runtime_5.0.RC2_linux-aarch64.run --install

将新挂载的盘设置为docker容器使用路径:

vim /etc/systemd/system/docker.service
#   在ExecStart=/usr/bin/dockerd $OPTIONS这一行的\之前增加(这里容易配错,请仔细看下面截图)
-g /docker

重启docker使得上述安装和配置生效:

systemctl daemon-reload && systemctl restart docker
【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。