作者小头像 Lv.6
更多个人资料
2047 成长值
1 关注
112 粉丝
+ 关注 私信

个人介绍

昇腾异构计算架构CANN,助力释放硬件澎湃算力!

感兴趣或擅长的领域

人工智能
个人勋章
  • 小有名气
成长雷达
2000
27
0
0
20

个人资料

个人介绍

昇腾异构计算架构CANN,助力释放硬件澎湃算力!

感兴趣或擅长的领域

人工智能

达成规则

以上满足项可达成此勋章

  • 博客
  • 关注
  • 粉丝
  • 论坛
全部时间
全部时间
最近三天
最近一周
最近一月
  • 全部
  • Ascend C
5月18日直播|CANNBot进阶课程Vector算子之排序性能优化
5月18日直播|CANNBot进阶课程Vector算子之排序性能优化
视频直播
作者小头像 昇腾CANN 2026-05-16 21:52:34
72
0
0
2026-05-16 21:52:34
72
0
0
开发者说直播预告|5月14日19:00,SignBitsUnpack算子社区任务开发指南
系统讲解如何参与社区任务的全流程,并结合实际案例,深入解析SignBitsUnpack算子的开发过程。通过本课程,了解从认领任务到提交贡献的完整参与路径,掌握该算子的设计思路与实现细节,为后续参与社区开发打下扎实基础。
开发者 视频直播
作者小头像 昇腾CANN 2026-05-13 14:38:20
1072
0
0
2026-05-13 14:38:20
999+
0
0
5月13日直播|多模态生成推理优化的"三板斧":算得轻、算得少、算得巧
背景随着多模态生成模型参数量与序列长度持续攀升,高分辨率长时视频生成的推理面临的长序列挑战日益严峻。如何在保证生成质量的前提下,走通高性能与低占存的算法与工程化路径?本次直播以典型开源模型为例,带大家了解如何在昇腾上实践多模态生成的典型优化:稀疏Attention模式设计、量化Attention低精度策略、分布式并行方案选型,以及DiT层级特征Cache与复用机制。结合昇腾NPU集群通信拓扑...
视频直播
作者小头像 昇腾CANN 2026-05-12 20:15:48
1376
1
0
2026-05-12 20:15:48
999+
1
0
【企业对话专场直播预告】|4月23日19:00,基于CANN的xLLM推理引擎工程化落地
4月23日19:00,基于CANN的xLLM推理引擎工程化落地
视频直播
作者小头像 昇腾CANN 2026-04-22 16:11:50
9339
0
0
2026-04-22 16:11:50
999+
0
0
4月14日直播|CANNBot 开发进阶:Ascend C算子开发实操
4月14日直播|CANNBot 开发进阶:Ascend C算子开发实操
视频直播
作者小头像 昇腾CANN 2026-04-13 20:47:50
12681
0
0
2026-04-13 20:47:50
999+
0
0
【Meetup限时报名】诚邀您共飨面向Ascend 950的热门技术与前沿创新
【Meetup限时报名】诚邀您共飨面向Ascend 950的热门技术与前沿创新
作者小头像 昇腾CANN 2026-04-09 16:24:25
281
0
0
2026-04-09 16:24:25
281
0
0
3月26日直播|PTO ISA带你掌握Ascend 950的奥秘
3月26日直播|PTO ISA带你掌握Ascend 950的奥秘
视频直播
作者小头像 昇腾CANN 2026-03-25 09:25:09
19801
0
0
2026-03-25 09:25:09
999+
0
0
3月24日直播|HCCL集合通信专用引擎CCU技术介绍
在AI计算集群规模持续扩大的背景下,集合通信效率成为影响系统整体性能的关键因素。集合通信处理器(CCU)是昇腾NPU中用于加速集合通信任务的专用协处理器,其主要目标是解决传统通信方式中性能瓶颈,提升整体系统性能。关键组成部分CCUM和CCUA单元CCUM:控制单元,解析任务描述符并执行通信任务。CCUA:数据处理单元,处理数据传输和规约。基本构成单元Memory Slice (MS):4KB...
视频直播
作者小头像 昇腾CANN 2026-03-24 14:20:05
20144
0
0
2026-03-24 14:20:05
999+
0
0
HiFloat8:为大模型训推走出精度与性能的“既要又要”之路
随着深度学习模型规模的不断增大,模型的训练和推理对计算效率、显存占用和能耗的要求也越来越高。低比特(8bit整型/8bit浮点)数据格式应运而生。其核心思想是使用更少的比特位来表示计算密集且对精度敏感度较低的模块,如模型参数(权重)和中间计算结果(激活值)等。HiFloat8(HiF8) 是一种新型的 8 位浮点格式。它创新地提出点位域Dot设计,实现即时可译变长前缀码编码。这样的设计使得格...
机器学习
作者小头像 昇腾CANN 2026-03-23 15:16:25
545
0
0
2026-03-23 15:16:25
545
0
0
3月20日直播|探索Ascend 950的性能天花板
随着Agent技术规模化落地,模型越做越大,算力需求早已不是线性增长,而是指数级膨胀。面对巨大的算力诉求,我们的选择不是使用更多的卡,而是让每一张卡,释放更大的潜能。Ascend 950通过对CANN进行算子级的深度优化,使核心算子的MAC利用率接近理论极限,大大提升了算力效率。针对大模型的矩阵运算、注意力机制等场景,Ascend 950升级了计算架构,让算力供给精准匹配算法需求。Ascen...
视频直播
作者小头像 昇腾CANN 2026-03-19 20:28:09
21694
0
0
2026-03-19 20:28:09
999+
0
0
总条数:187
10
10
20
50
100
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • ...
  • 19

上滑加载中

https://www.baidu.com/s?ie=utf-8&f=3&rsv_bp=0&rsv_idx=1&tn=baidu&wd=sed%20%E6%9B%BF%E6%8D%A2%E5%AD%97%E7%AC%A6%E4%B8%B2&rsv_pq=c7db61a600035dc5&rsv_t=5e19yEsbV9N5fIvdlGRU
作者小头像
作者小头像
快速交付
+ 关注