[昇腾]Atlas800(鲲鹏920+昇腾Snt9处理器)环境配置指导
1. 环境描述
服务器信息: 华为云Snt9裸金属服务器
操作系统: Euler2.8
本文安装环境相关操作: 升级预置的C78固件和驱动到C86(6.3.RC2) 、配置磁盘、安装docker、配置源
2. ASCEND环境安装指南
2.1 磁盘合并挂载
首次配置环境时,需要先处理磁盘分配,这样可以把机器上的SSD盘空间用起来。这一步操作放在最开始,避免使用一段时间再挂载容易冲掉用户已存储的内容。
首先通过df -h查看是否已经有几个T的存储空间,如果有代表已挂载过,可跳过此章节,只用直接在/home目录下创建自己的个人开发目录即可。
执行挂载操作,查看系统存储信息(fdisk -l),可以看到有三块nvme SSD硬盘(/dev/nvme0n1、/dev/nvme1n1、/dev/nvme2n1)
我们将/dev/nvme0n1挂载在/home下供每人创建自己的家目录,另两个合并挂载到/docker下供容器使用,如果不单独给docker分配较大空间,当多人共用时起多个容器很容易将根目录撑满。
# 第一块盘给用户存数据用
mkfs -t xfs /dev/nvme0n1
mkdir -p /data/home
mv /home/* /data/home/
mount /dev/nvme0n1 /home
mv /data/home/* /home/
rm -rf /data/home
cd /home
mkdir -p 个人目录名
# 后两块盘给docker容器使用,多块盘合并成一个文件系统目录需要涉及pv/vg/lv,了解概念可参考:https://www.linuxidc.com/Linux/2017-05/143724.htm
# 创建pv(物理卷 physical volume 基本存储逻辑块)
pvcreate /dev/nvme1n1
pvcreate /dev/nvme2n1
# 创建vg(卷组 Volume Group 这里将两块pv组成一个组)
vgcreate nvme_group /dev/nvme1n1 /dev/nvme2n1
# 创建lv(逻辑卷 logical volume 可以在组里划分逻辑存储,每个lv可对应文件系统比如/home或者/usr等,这里将100%的VG空间都给这个lv)
lvcreate -l 100%VG -n docker_data nvme_group
# 格式化分区
mkfs -t xfs /dev/nvme_group/docker_data
# 挂载到/docker目录
mkdir /docker
mount /dev/nvme_group/docker_data /docker
查看UUID:
blkid /dev/nvme_group/docker_data
blkid /dev/nvme0n1
设置开机启动自动挂载:
vim /etc/fstab
# 文件末尾一行填写以下内容:
UUID=上一步查询出的UUID值1 /docker xfs defaults 0 0
UUID=上一步查询出的UUID值2 /home xfs defaults 0 0
执行如下命令检测配置文件正确性:
mount -a
如果没有错误输出则代表配置正确,这里务必保证配置正确,如果配置错误会导致机器重启时无法正常启动。
配置完成后,执行df -h可以看到新挂载的盘信息。
2.2 固件和驱动升级
首先查看当前拿到的机器的固件和驱动版本:
for i in `seq 0 7`; do npu-smi info -t board -i $i; done | egrep -i "software|firmware"
输出结果如下:
其中firmware代表固件版本,software代表驱动版本,当前910机器购买后预装的版本不是最新的发布版本,建议升级固件驱动版本到最新版本。
下载固件和驱动包
区域:乌兰察布一
# 下载固件包 (当前商用发布的最新版)
wget https://cn-north-9-rse.obs.cn-north-9.myhuaweicloud.com/drivers/Ascend-hdk-910-npu-firmware_6.4.12.1.241.run
# 下载驱动包 (当前商用发布的最新版)
wget https://cn-north-9-rse.obs.cn-north-9.myhuaweicloud.com/drivers/Ascend-hdk-910-npu-driver_23.0.rc2_linux-aarch64.run
升级固件
chmod 700 *.run
bash Ascend-hdk-910-npu-firmware_6.4.12.1.241.run --full
# 升级完成后需要重启
reboot
升级驱动,提示处输入“y”,
bash Ascend-hdk-910-npu-driver_23.0.rc2_linux-aarch64.run --full
# 根据提示执行reboot
reboot
重启执行成功后,通过下述命令,查看当前固件和驱动版本
for i in `seq 0 7`; do npu-smi info -t board -i $i; done | egrep -i "software|firmware"
输出版本号如下则表示升级成功:
2.3 安装docker
如果有使用docker的需求,可以按照如下指导安装docker
1. 下载二进制包
官方下载地址:https://download.docker.com/linux/static/stable/aarch64/
尽量选用比较新的稳定版本,本样例以20.10.9为例
wget https://download.docker.com/linux/static/stable/aarch64/docker-20.10.9.tgz
准备脚本:vi docker.service 填入以下内容
[Unit]
Description=Docker Application Container Engine
Documentation=https://docs.docker.com
After=network-online.target firewalld.service
Wants=network-online.target
[Service]
Type=notify
EnvironmentFile=-/etc/sysconfig/docker
EnvironmentFile=-/etc/sysconfig/docker-storage
EnvironmentFile=-/etc/sysconfig/docker-network
Environment=GOTRACEBACK=crash
ExecStart=/usr/bin/dockerd $OPTIONS \
$DOCKER_STORAGE_OPTIONS \
$DOCKER_NETWORK_OPTIONS \
$INSECURE_REGISTRY
ExecReload=/bin/kill -s HUP $MAINPID
LimitNOFILE=1048576
LimitNPROC=1048576
LimitCORE=infinity
# set delegate yes so that systemd does not reset the cgroups of docker containers
Delegate=yes
# kill only the docker process, not all processes in the cgroup
KillMode=process
[Install]
WantedBy=multi-user.target
安装脚本 vi install.sh 填入以下内容
#!/bin/sh
echo '解压tar包...'
tar -zxf $1
echo '将docker目录移到/usr/bin目录下...'
cp -af docker/* /usr/bin/
echo '将docker.service 移到/etc/systemd/system/ 目录...'
cp –af docker.service /etc/systemd/system/
echo '添加文件权限...'
chmod +x /etc/systemd/system/docker.service
echo '重新加载配置文件...'
systemctl daemon-reload
echo '启动docker...'
systemctl start docker
echo '设置开机自启...'
systemctl enable docker.service
echo 'docker安装成功.'
执行脚本进行安装,包名根据具体下载的版本替换:
chmod 700 install.sh
sh install.sh docker-20.10.9.tgz
查看版本信息,正常输出表示安装成功
docker version
配置IP转发,用于容器内的网络访问:
vi /etc/sysctl.conf
# 修改/etc/sysctl.conf 系统配置,修改此项值为1
net.ipv4.ip_forward = 1
# 从文件读取配置
sysctl -p
点击链接下载社区版Ascend docker runtime,这个包是昇腾开发的docker插件,在docker run时可以自动挂载昇腾driver等路径到容器。下载好后将包上传到服务器并进行安装:
chmod 700 *.run
./Ascend-docker-runtime_5.0.RC2_linux-aarch64.run --install
将新挂载的盘设置为docker容器使用路径:
vim /etc/systemd/system/docker.service
# 在ExecStart=/usr/bin/dockerd $OPTIONS这一行的\之前增加(这里容易配错,请仔细看下面截图)
-g /docker
重启docker使得上述安装和配置生效:
systemctl daemon-reload && systemctl restart docker
- 点赞
- 收藏
- 关注作者
评论(0)