【昇腾】Ascend Snt9B裸金属服务器DMA及P2P性能测试指导

举报
modelarts-dev-server 发表于 2023/12/02 09:55:06 2023/12/02
【摘要】 1. 环境描述笔者使用华为云ModelArts弹性裸金属服务器-Ascend Snt9B服务器进行DMA及P2P性能测试.选择的服务器镜像是:  EulerOS-2.10-Arm-rc3-64bit-for-Snt9B-BareMetal-with-CANN7.0.RC1该镜像已经安装ascend-dmi,并进行了环境配置,可以直接使用。2.DMA测试2.1  测试Host传输到Device...

1. 环境描述

笔者使用华为云ModelArts弹性裸金属服务器-Ascend Snt9B服务器进行DMA及P2P性能测试.

选择的服务器镜像是:  EulerOS-2.10-Arm-rc3-64bit-for-Snt9B-BareMetal-with-CANN7.0.RC1

该镜像已经安装ascend-dmi,并进行了环境配置,可以直接使用。

2.DMA测试

2.1  测试Host传输到Device

ascend-dmi --bw -t h2d -d 0 -s 8388608 --et 100

该命令表示:按照定长模式,测试数据从Host侧传输到Device 0,迭代100次的带宽与时延。

1.png

ascend-dmi --bw -t h2d -d 0 --et 100

该命令表示:按照步长模式,测试数据从Host侧传输到Device 0,迭代100次的带宽与时延。

2.png

2.2 测试Device传输到Host

ascend-dmi --bw -t d2h -d 0 --et 100
该命令表示:按照步长模式,测试数据从Device 0侧传输到Host侧,迭代100次的带宽与时延。

3.png


3. P2P测试

3.1 指定源Device到目标Device

ascend-dmi --bw -t p2p --ds 1 --dd 2

该命令表示:按照步长模式,测试从Device 1传输到Device 2的带宽与时延。

该测试包含两类场景:

Unidirectional:数据单向传输,即数据流方向为从Device 1传输到Device 2;

Bidirectional: 数据双向传输,即Device 1和Device 2均发送和接收数据流。

4.png

5.png

3.2 不指定源Device和目标Device

ascend-dmi --bw -t p2p

该命令表示:按照步长模式,测试从每个Device传输到其他所有Device的带宽。

该测试包含Unidirectional和Bidirectional两类场景。

6.png

附命令中参数说明:

参数 说明 是否必填
[-bw, --bw, --bandwidth]

使用该参数测试芯片的带宽。建议使用--bw

[-t, --type]

指测试数据流向的分类。

当使用带宽和时延测试功能时,测试的数据流可以分为以下方向,若不填写数据流方向则默认返回h2d、d2h、d2d三个方向的带宽和时延信息。
  • h2d:指数据从Host侧内存通过PCIe总线搬移到Device侧内存,测试整体带宽及时延。
  • d2h:指数据从Device侧内存通过PCIe总线搬移到Host侧内存,测试整体带宽及时延。
  • d2d:指数据从Device侧内存搬移到同一Device侧内存(主要是用于测试Device侧的内存带宽),测试整体带宽及时延。
  • p2p:测试指定源头Device到目标Device的传输速率和时延。当p2p测试不指定Device时,采用默认方式进行测试,不需要输入size、et、format等参数,输入这些参数也不会影响默认方式的结果。
[-s, --size]

指传输数据大小并指定测试结果显示方式,传输数据的取值范围为1Byte~512M,单位为字节。

显示方式分为定长模式和步长模式。若“-s”参数缺省则为步长模式,输出传输数据的带宽测试结果,传输数据的范围为2Byte~32M。若“-s”参数不缺省则为定长模式,“-s”参数后必须填写数值指定传输数据的大小,不填写属于错误写法。

除此之外,当使用p2p模式,若“-s”参数缺省,默认传输数据值为128M。Atlas A2训练系列产品下,0卡或8卡到其他卡默认传输数据值为512M,除此之外,默认传输数据值为256M。

若“-s”参数不缺省,“-s”参数后必须填写数值指定传输数据的大小,不填写属于错误写法。

[-et, --et, --execute-times]

指迭代次数,即内存拷贝次数。

取值范围为[1, 1000],若不填写,步长模式下拷贝次数则默认为5,定长模式下拷贝次数则默认为40。

[-d, --device] 指定需要测试带宽的Device ID,Device ID是指昇腾芯片的ID,用户可以执行ascend-dmi --info命令,在显示界面表格中的Chip参数处获得芯片数量。若不填写Device ID则默认返回Device 0带宽信息。
[-ds, --ds, --device-src] 指定p2p测试的源Device的ID号。必须与[-dd, --dd, --device-dst]参数成对指定。
[-dd, --dd, --device-dst] 指定p2p测试的目标Device的ID号。必须与[-ds, --ds, --device-src]参数成对指定。
【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。