【CANN训练营】基于昇腾CANN平台的AI CPU算子开发——课程笔记1(跑通例程)

举报
dayao 发表于 2022/07/22 23:03:09 2022/07/22
【摘要】 目录:1、前言——请移步官方文档2、硬件基础——了解NPU架构,才能明白AI cpu算子运行在哪儿,能干些啥3、实际操作——MindStudio(windows版),远程连接到ECS服务器(CANN软件包),跑通例程一、前言:       官方文档链接:https://www.hiascend.com/document/detail/zh/CANNCommunityEdition/60RC1...

目录:

1、前言——请移步官方文档

2、硬件基础——了解NPU架构,才能明白AI cpu算子运行在哪儿,能干些啥

3、实际操作——MindStudio(windows版),远程连接到ECS服务器(CANN软件包),跑通例程

一、前言:

       官方文档链接:

https://www.hiascend.com/document/detail/zh/CANNCommunityEdition/60RC1alpha001/opdevg/aicpudevg   (配套CANN 6.0.RC1.alpha001)。

        查看最新版本文档——去昇腾主页 https://www.hiascend.com/zh/ ,右上角点击 “文档”,然后“开发者文档(社区版)”/“算子开发”/“AI CPU算子开发”,

    

二、硬件基础:

        AI CPU算子的应用场景:——可以全网下沉到NPU上运行。

  • 不适合跑在AI Core上的算子,例如非矩阵类的复杂计算,逻辑比较复杂的分支密集型算子等。

    例如,Dump、profiling等控制算子,Queue、Stack等资源状态类算子,TopK、Where等检索类算子。

  • AI Core不支持的算子,算子需要某些数据类型,但AI Core不支持,例如Complex32、Complex64。
  • 某些场景下,为了快速打通网络在昇腾AI处理器的执行流程,在TBE实现自定义算子较为困难的情况下,可通过自定义AI CPU算子进行功能调测,提升调测效率。功能调通之后,后续性能调测过程中再将AI CPU自定义算子转换为TBE算子实现。

三、实际操作:

      采用Windows版MindStudio,远程连接装好CANN软件包的ECS服务器,进行算法样例的运行、测试。

      1)购买ECS服务器,使用镜像,CANN版本

       2)下载与CANN版本对应的MindStudio——使用免安装压缩版本即可

       3)打开MindStudio自带的AI cpu算子例程

1、 2、

       4)设置MindStudio远程使用ECS中的CANN

    5)运行例程

   选择less的UT例程测试

开始运行:

运行结束:

ERROR报错不是程序运行错误,而是在异常数据下,正常的结果。


【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。