Lv.2
zjun
更多个人资料
100
成长值
0
关注
1
粉丝
+ 关注
私信
个人介绍
AI追风者
感兴趣或擅长的领域
人工智能、开发语言、昇腾
个人勋章
TA还没获得勋章~
成长雷达
100
0
0
0
0
个人资料
个人介绍
AI追风者
感兴趣或擅长的领域
人工智能、开发语言、昇腾
达成规则
以上满足
项可达成此勋章
博客
关注
粉丝
论坛
全部时间
全部时间
最近三天
最近一周
最近一月
全部
Ascend
Ascend Extension for PyTorch是个what?
1 Ascend Extension for PyTorchAscend Extension for PyTorch 插件是基于昇腾的深度学习适配框架,使昇腾NPU可以支持PyTorch框架,为PyTorch框架的使用者提供昇腾AI处理器的超强算力。项目源码地址请参见LINK。昇腾为基于昇腾处理器和软件的行业应用及服务提供全栈AI计算基础设施。您可以通过访问昇腾社区,了解关于昇腾的更多信息...
pytorch
昇腾
zjun
2024-11-09 23:34:13
321
0
0
2024-11-09 23:34:13
321
0
0
如何使用Ascend的ATB加速库?
Ascend Transformer Boost加速库(下文简称为ATB加速库)是一款高效、可靠的加速库,基于华为Ascend AI处理器,专门为Transformer类模型的训练和推理而设计
人工智能
昇腾
机器学习
深度学习
神经网络
zjun
2024-11-09 23:33:27
791
0
0
2024-11-09 23:33:27
791
0
0
ATB算子实现原理解读
在Ascend Transformer Boost加速库(ATB)中存在三种类型的算子,那么这三种类型的算子,它们的执行流程是什么,和其它的CANN中的算子有什么区别。
人工智能
昇腾
深度学习
zjun
2024-11-09 23:31:41
477
0
0
2024-11-09 23:31:41
477
0
0
ATB是什么?
Ascend Transformer Boost加速库(下文简称为ATB加速库)是一款高效、可靠的加速库,基于华为Ascend AI处理器,专门为Transformer类模型的训练和推理而设计。
昇腾
机器学习
深度学习
神经网络
zjun
2024-11-09 23:26:50
491
0
0
2024-11-09 23:26:50
491
0
0
msprofiler前置知识:如何看懂tracing profile文件?
Tracing 是一种收集程序执行过程中事件的技术。它记录了程序运行时发生的事件,如函数调用、I/O操作、系统调用等。在Web开发中,Tracing 通常用于收集浏览器渲染页面时的性能数据,包括CPU活动、内存使用情况、网络请求等。
人工智能
昇腾
机器学习
深度学习
zjun
2024-11-09 19:12:08
274
0
0
2024-11-09 19:12:08
274
0
0
Ascend C的编程模型
1 并发执行Ascend C和cudnn相似,都是一种多核心编程的范式。想要了解Ascend C,必须得先掌握这种“多核”是怎么实现得。多核执行,说白了就是使用CPU/GPU/Ascend的物理多核并发去执行一段流程,一般情况下,可以通过以下几种方式实现:多线程并行处理:使用多线程可以将循环中的任务分配给多个线程同时执行,提高代码的执行效率。可以使用线程池来管理线程的创建和销毁,避免频繁创...
人工智能
昇腾
深度学习
zjun
2024-11-09 19:10:44
279
0
0
2024-11-09 19:10:44
279
0
0
AscendC从入门到精通系列(五)调用基于工程开发AscendC算子
单算子API调用方式,是指直接调用单算子API接口,基于C语言的API执行算子。算子工程AscendC从入门到精通系列(三)基于自定义算子工程开发AscendC算子 - 知乎 (zhihu.com)创建完成后,基于工程代码框架完成算子原型定义、kernel侧算子实现、host侧tiling实现,通过工程编译脚本完成算子的编译部署,之后再进行单算子API的调用。 1 基本原理完成自定义算子编译...
人工智能
昇腾
深度学习
神经网络
zjun
2024-11-09 14:14:46
674
0
0
2024-11-09 14:14:46
674
0
0
AscendC从入门到精通系列(四)使用Pybind调用AscendC算子
如果已经通过Ascend C编程语言实现了算子,那该如何通过pybind进行调用呢? 1 Pybind调用介绍通过PyTorch框架进行模型的训练、推理时,会调用很多算子进行计算,其中的调用方式与kernel编译流程有关。对于自定义算子工程,需要使用PyTorch Ascend Adapter中的OP-Plugin算子插件对功能进行扩展,让torch可以直接调用自定义算子包中的算子,详细内容...
人工智能
昇腾
深度学习
神经网络
zjun
2024-11-09 13:57:48
735
0
0
2024-11-09 13:57:48
735
0
0
AscendC从入门到精通系列(三)基于自定义算子工程开发AscendC算子
本次主要讨论下AscendC另外一种开发流程,基于自定义算子工程的算子开发。从算子工程创建、代码编写、编译部署到运行验证的开发全流程,让您对算子开发工程有个宏观的认识,此处我们以输入是动态shape(主要体现在tiling)的Add算子实现为例,为了与内置Add算子区分,定义算子类型为AddCustom。 1、创建工程CANN软件包中提供了工程创建工具msOpGen,开发者可以输入算子原型定...
人工智能
昇腾
机器学习
深度学习
zjun
2024-11-09 13:45:05
700
0
0
2024-11-09 13:45:05
700
0
0
AscendC从入门到精通系列(二)基于Kernel直调开发AscendC算子
本次主要讨论下AscendC算子的开发流程,基于Kernel直调工程的算子开发。 1 AscendC算子开发的基本流程使用Ascend C完成Add算子核函数开发;使用ICPU_RUN_KF CPU调测宏完成算子核函数CPU侧运行验证;使用<<<>>>内核调用符完成算子核函数NPU侧运行验证。在正式的开发之前,还需要先完成环境准备和算子分析工作,开发Ascend C算子的基本流程如下图所示:...
人工智能
昇腾
深度学习
神经网络
zjun
2024-11-09 13:29:49
658
0
0
2024-11-09 13:29:49
658
0
0
总条数:19
10
10
20
50
100
1
2
上滑加载中
https://www.baidu.com/s?ie=utf-8&f=3&rsv_bp=0&rsv_idx=1&tn=baidu&wd=sed%20%E6%9B%BF%E6%8D%A2%E5%AD%97%E7%AC%A6%E4%B8%B2&rsv_pq=c7db61a600035dc5&rsv_t=5e19yEsbV9N5fIvdlGRU
+ 关注