【昇腾】Snt9B Euler2.10操作系统和验证结果
1. 操作系统详情
组件 | 详情 |
操作系统 | EulerOS 2.10 Arm 64bit sdi3 for BareMetal With Uniagent |
内核版本 | 4.19.90-vhulk2211.3.0.h1543.eulerosv2r10.aarch64 |
NPU-Driver | 23.0.rc2 |
Firmware | 6.4.0.2.220 |
Docker | 24.0.5 |
Docker-runtime | Ascend-docker-runtime_5.0.RC2_linux-aarch64.run |
CANN | Ascend-cann-toolkit_6.3.RC2_linux-aarch64.run |
二进制算子包 | Ascend-cann-kernels-910b_6.3.RC2_linux.run |
MindX DL ToolBolx | Ascend-mindx-toolbox_5.0.RC2_linux-aarch64.run |
MindSpore Lite | mindspore_lite-2.1.0-cp37-cp37m-linux_aarch64.whl |
OpenMpi | openmpi-4.1.4 |
Mpich | mpich-3.2.1 |
2. 验证 - npu-smi info输出结果
3. 验证 - all_reduce_test测试结果
all_gather_test,all_reduce_test,alltoallv_test,broadcast_test,reduce_scatter_test,reduce_test
以上每一个可执行文件对应一个集合通信算子
(1) 单机单卡:mpirun -n 1 ./bin/all_reduce_test -b 8 -e 1024M -f 2 -p 8
(2) 单机多卡:mpirun -n 8 ./bin/all_reduce_test -b 8 -e 1024M -f 2 -p 8
4. 验证 - RoCE网卡性能测试结果
(1) 一些命令
工具复位RoCE网卡测试状态: hccn_tool -i 0 -roce_test reset
测试网卡状态:for i in $(seq 0 7);do hccn_tool -i $i -net_health -g;done
测试结果总结: 单RoCE卡 23.3GB * 8 = 186.6Gb (基本符合预期)
服务端:hccn_tool -i 0 -roce_test ib_send_bw -s 409600000 -n 1000 -tcp
客户端:hccn_tool -i 1 -roce_test ib_send_bw -s 4096000 -n 1000 address 29.34.20.7 -tcp
5. 关于磁盘分区
root用户的家目录预制了create_disk_partitions.sh脚本,可用于给/home目录创建专用的磁盘分区,以及给/docker目录创建专用的磁盘分区用户存放docker镜像。
chmod +x create_disk_partitions.sh
./create_disk_partitions.sh
- 点赞
- 收藏
- 关注作者
评论(0)