作者小头像 Lv.2
更多个人资料
110 成长值
0 关注
0 粉丝
+ 关注 私信

个人介绍

这个人很懒,什么都没有留下

感兴趣或擅长的领域

暂无数据
个人勋章
TA还没获得勋章~
成长雷达
110
0
0
0
0

个人资料

个人介绍

这个人很懒,什么都没有留下

感兴趣或擅长的领域

暂无数据

达成规则

以上满足项可达成此勋章

  • 博客
  • 关注
  • 粉丝
  • 论坛
全部时间
全部时间
最近三天
最近一周
最近一月
  • 全部
  • ascend案例
了解集合通信与模型并行策略
了解集合通信基础概念及常见的集合通信原语;以及大模型并行策略:包括数据并行、流水并行、张量并行和专家并行。
机器学习
作者小头像 yd_294961020 2025-06-24 14:28:15
434
0
0
2025-06-24 14:28:15
434
0
0
离线推理性能问题分析
传统模型迁移到昇腾设备上出现了性能问题,介绍性能问题的定位方法和解决方案,重点介绍了性能问题的定位定界方法。
应用性能调优
作者小头像 yd_294961020 2025-06-23 14:51:19
377
0
0
2025-06-23 14:51:19
377
0
0
离线推理精度问题分析
传统模型迁移到昇腾设备上出现了精度问题,介绍精度问题的定位方法和解决方案,重点介绍了精度问题的定位定界方法。
pytorch
作者小头像 yd_294961020 2025-06-23 11:46:21
661
0
0
2025-06-23 11:46:21
661
0
0
离线推理全流程&模型调优
整体概述ModelZoo-PyTorch指导文档:https://gitee.com/ascend/ModelZoo-PyTorch/blob/master/ACL_PyTorch/docs/README.md 模型推理 离线推理 导出Onnx参考链接:ONNX的导出 Onnx转om参考链接1:Onnx转Om参考链接2:ATC工具介绍 离线推理参考链接:离线推理 Chinese_CLIP上...
昇腾
作者小头像 yd_294961020 2025-06-20 16:50:53
371
0
0
2025-06-20 16:50:53
371
0
0
搞定昇腾软件版本配套问题
场景开发者拿到一个裸机环境,如800I A2/800T A2, 或Atlas 800 3000推理服务器(里面插了Iduo卡),需要用户根据OS版本去安装配套的固件驱动、Mind系列软件等。 物理机安装场景1.先看安装指导:点击链接2.查询操作系统兼容性:点击链接3.确认固件驱动和CANN版本配套:点击链接一般建议选择新版本CANN和固件驱动,固件驱动有多个兼容版本,建议选最新版本。(可以...
昇腾
作者小头像 yd_294961020 2025-06-20 15:36:28
430
0
0
2025-06-20 15:36:28
430
0
0
基于llama-factory的昇腾实战
环境安装(在安装好cann的容器执行)git clone https://github.com/hiyouga/LLaMA-Factory.gitcd LLaMA-Factorypip install -e ".[torch-npu,metrics]"# 查看安装的版本llamafactory-cli env 全流程实践 原始模型推理cd LLaMA-Factory# 需要提前下载好模型权...
作者小头像 yd_294961020 2025-06-20 10:23:41
365
0
0
2025-06-20 10:23:41
365
0
0
服务化参数调优实战
服务化性能调优 前置准备完成MindIE环境的安装,参考链接下载好要调优的模型权重下载好性能测试数据集 调优流程下面以Llama3-8B为例,讲解调优全流程 1.查看模型权重大小Llama3-8B权重为15GB 2.计算npuMemSize计算公式为:Floor[(单卡显存-空闲占用-权重/NPU卡数)* 系数],系数取值为0.8单卡空闲显存:61GB空闲占用:约3GBnpuMemSize...
昇腾
作者小头像 yd_294961020 2025-04-18 11:47:17
794
0
0
2025-04-18 11:47:17
794
0
0
MindIE Torch快速上手
MindIE Torch整体介绍 整体架构 推理迁移工作流 关键特性 特性1:配合torch_npu实现子图+单算子混合执行 特性2:支持C++和Python编程 特性3:支持TorchScript、ExportedProgram多种模式 特性4:支持静态Shape、动态Shape模型编译 MindIE Torch demo开发 MindIE Torch整体介绍 整体架构 推理迁移工作流 ...
昇腾
作者小头像 yd_294961020 2025-04-17 21:12:10
855
0
0
2025-04-17 21:12:10
855
0
0
DeepSeek-R1-Distill-Qwen-1.5B基于MindIE推理实践
1 实验目标 1.1 实验目标掌握纯模型的精度和性能测试掌握服务化的部署掌握服务化的精度和性能测试 2 前置准备 2.1 准备推理环境 2.1.1 下载镜像1)进入登录昇腾镜像仓库:https://www.hiascend.com/developer/ascendhub查询mindie2)申请权限后,下载对应的镜像版本 2.1.2 拉起容器docker run -itd --privile...
作者小头像 yd_294961020 2025-03-10 17:51:29
1006
0
0
2025-03-10 17:51:29
999+
0
0
MindIE对接vLLM框架开发指南
vLLM适配昇腾方案参考官方文档:linkvLLM框架在昇腾环境适配的整体方案为上层运行vLLM框架原生的逻辑,包括请求调度、Batch组建、Ray分布式拉起多卡服务等;下层模型推理与后处理通过MindIE LLM提供的GeneratorTorch统一接口接入MindIE模型仓统一进行管理,实现加速库整图模式的模型推理加速。vLLM框架下层模型推理对接Text Generator接口的基本...
昇腾
作者小头像 yd_294961020 2025-01-17 14:47:23
12883
0
0
2025-01-17 14:47:23
999+
0
0
总条数:11
10
10
20
50
100
  • 1
  • 2

上滑加载中

https://www.baidu.com/s?ie=utf-8&f=3&rsv_bp=0&rsv_idx=1&tn=baidu&wd=sed%20%E6%9B%BF%E6%8D%A2%E5%AD%97%E7%AC%A6%E4%B8%B2&rsv_pq=c7db61a600035dc5&rsv_t=5e19yEsbV9N5fIvdlGRU
作者小头像
作者小头像
快速交付
+ 关注