【CANN文档速递04期】揭秘昇腾CANN算子开发

昇腾CANN 发表于 2022/06/24 15:42:04 2022/06/24

【摘要】本期我们主要带您了解CANN自定义算子的类型，编译、运行逻辑架构，以及算子的开发流程等，让您对CANN算子有宏观的了解。

昇腾开发者在进行神经网络模型训练或者推理的过程中，往往会遇到以下场景：

此时我们就需要考虑进行自定义算子的开发，本期我们主要带您了解CANN自定义算子的类型，编译、运行逻辑架构，以及算子的开发流程等，让您对CANN算子有宏观的了解。

CANN自定义算子类型

CANN自定义算子有两种类型：TBE算子与AI CPU算子，两种算子的区别如下所示。

其中AI CPU算子的实现相对简单，TBE算子的实现较复杂，但性能更优。若用户为了快速打通模型执行流程，可选择自定义AI CPU算子，从而提升调测效率。功能调通后，后续在性能调测过程中再将AI CPU算子切换到TBE算子实现。

下面我们了解下CANN算子的编译流程，如下图所示：

第三方框架网络模型经过Parser解析后，转换为中间态的IR (Intermediate Representation) Graph。
GE接收IR Graph后对图进行准备、拆分、子图优化等操作。
子图优化过程中，会进行算子的匹配选择，优先由FE基于TBE算子信息库判断算子支持度，若TBE不支持，则由AI CPU Engine基于AI CPU算子信息库判断是否支持。
GE将拆分后的子图合并、优化，并进行编译，编译过程中会生成算子的Task信息，最终生成可执行的om模型。

首先GE下发算子执行请求给Runtime，然后Runtime会判断算子的Task类型，若是TBE算子，则将算子执行请求下发到AI Core上执行；若是AI CPU算子，则将算子执行请求下发到AI CPU上执行。

浅紫色底纹的为算子开发交付件，交付件介绍如下：

开发者可自行选择算子开发方式，并基于如上规则在对应目录下进行交付件的开发。