【CANN训练营】基于昇腾CANN平台的AI CPU算子开发——课程笔记1(跑通例程)
目录:
1、前言——请移步官方文档
2、硬件基础——了解NPU架构,才能明白AI cpu算子运行在哪儿,能干些啥
3、实际操作——MindStudio(windows版),远程连接到ECS服务器(CANN软件包),跑通例程
一、前言:
官方文档链接:
https://www.hiascend.com/document/detail/zh/CANNCommunityEdition/60RC1alpha001/opdevg/aicpudevg (配套CANN 6.0.RC1.alpha001)。
查看最新版本文档——去昇腾主页 https://www.hiascend.com/zh/ ,右上角点击 “文档”,然后“开发者文档(社区版)”/“算子开发”/“AI CPU算子开发”,
二、硬件基础:
AI CPU算子的应用场景:——可以全网下沉到NPU上运行。
- 不适合跑在AI Core上的算子,例如非矩阵类的复杂计算,逻辑比较复杂的分支密集型算子等。
例如,Dump、profiling等控制算子,Queue、Stack等资源状态类算子,TopK、Where等检索类算子。
- AI Core不支持的算子,算子需要某些数据类型,但AI Core不支持,例如Complex32、Complex64。
- 某些场景下,为了快速打通网络在昇腾AI处理器的执行流程,在TBE实现自定义算子较为困难的情况下,可通过自定义AI CPU算子进行功能调测,提升调测效率。功能调通之后,后续性能调测过程中再将AI CPU自定义算子转换为TBE算子实现。
三、实际操作:
采用Windows版MindStudio,远程连接装好CANN软件包的ECS服务器,进行算法样例的运行、测试。
1)购买ECS服务器,使用镜像,CANN版本
2)下载与CANN版本对应的MindStudio——使用免安装压缩版本即可
3)打开MindStudio自带的AI cpu算子例程
1、 | 2、 |
4)设置MindStudio远程使用ECS中的CANN
5)运行例程
选择less的UT例程测试
开始运行:
运行结束:
ERROR报错不是程序运行错误,而是在异常数据下,正常的结果。
- 点赞
- 收藏
- 关注作者
评论(0)