【昇腾】Ascend Snt9B RoCE网卡带宽测试指导方案

举报
modelarts-dev-server 发表于 2023/11/27 11:41:36 2023/11/27
【摘要】 本文旨指导在华为云Ascend Snt9B裸金属服务器上进行 RoCE网卡带宽测试

1. 环境描述

笔者使用华为云ModelArts弹性裸金属服务器-Ascend Snt9B服务器进行RoCE网卡带宽测试。

选择的服务器镜像是:  EulerOS-2.10-Arm-rc3-64bit-for-Snt9B-BareMetal-with-CANN7.0.RC1

该镜像已经安装CANN和mpich,并进行了环境配置。

2. 多机ROCE网卡带宽 

(a) 科普查看昇腾的RoCE IP的方法

ROCEIP.png

(b) RoCE打流

s1:在接收端执行 -i 卡id

hccn_tool -i 7 -roce_test ib_send_bw -s 409600 -n 1000 -tcp

s2: 在发送端执行 -i 卡id   后面的ip为上一步接收端卡的ip

hccn_tool -i 0 -roce_test ib_send_bw -s 409600 -n 1000 address 29.39.151.164 -tcp

RoCE测试结果:

ROCE RESULT.png


附. 昇腾一些常用命令

(1) 查看网卡状态UP和DOWN

for i in {0..7};do hccn_tool -i ${i} -link -g;done

(2) 查看单节点内网卡IP连通性

for i in $(seq 0 7);do hccn_tool -i $i -net_health -g;done

(3)   当某网卡已经开始roce带宽测试时,再次启动任务会报错如下,解决这个问题需要关闭roce_test任务.

hccn_tool -i 7 -roce_test reset

20230920-095804(WeLinkPC).png

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。