yd_294961020的博客_云社区-华为云

Lv.2

yd_294961020

更多个人资料

110 成长值

0 关注

0 粉丝

+ 关注私信

个人介绍

这个人很懒，什么都没有留下

感兴趣或擅长的领域

暂无数据

个人勋章

TA还没获得勋章~

成长雷达

110

个人资料

个人介绍

这个人很懒，什么都没有留下

感兴趣或擅长的领域

暂无数据

达成规则

以上满足项可达成此勋章

博客
关注
粉丝
论坛

全部时间

最近一月

全部
ascend案例

了解集合通信与模型并行策略

了解集合通信基础概念及常见的集合通信原语；以及大模型并行策略：包括数据并行、流水并行、张量并行和专家并行。

机器学习

yd_294961020 2025-06-24 14:28:15

1011

2025-06-24 14:28:15

999+

离线推理性能问题分析

传统模型迁移到昇腾设备上出现了性能问题，介绍性能问题的定位方法和解决方案，重点介绍了性能问题的定位定界方法。

应用性能调优

yd_294961020 2025-06-23 14:51:19

752

2025-06-23 14:51:19

752

离线推理精度问题分析

传统模型迁移到昇腾设备上出现了精度问题，介绍精度问题的定位方法和解决方案，重点介绍了精度问题的定位定界方法。

pytorch

yd_294961020 2025-06-23 11:46:21

1695

2025-06-23 11:46:21

999+

离线推理全流程&模型调优

整体概述ModelZoo-PyTorch指导文档：https://gitee.com/ascend/ModelZoo-PyTorch/blob/master/ACL_PyTorch/docs/README.md 模型推理离线推理导出Onnx参考链接：ONNX的导出 Onnx转om参考链接1：Onnx转Om参考链接2：ATC工具介绍离线推理参考链接：离线推理 Chinese_CLIP上...

昇腾

yd_294961020 2025-06-20 16:50:53

808

2025-06-20 16:50:53

808

搞定昇腾软件版本配套问题

场景开发者拿到一个裸机环境，如800I A2/800T A2, 或Atlas 800 3000推理服务器（里面插了Iduo卡），需要用户根据OS版本去安装配套的固件驱动、Mind系列软件等。物理机安装场景1.先看安装指导：点击链接2.查询操作系统兼容性：点击链接3.确认固件驱动和CANN版本配套：点击链接一般建议选择新版本CANN和固件驱动，固件驱动有多个兼容版本，建议选最新版本。（可以...

昇腾

yd_294961020 2025-06-20 15:36:28

916

2025-06-20 15:36:28

916

基于llama-factory的昇腾实战

环境安装（在安装好cann的容器执行）git clone https://github.com/hiyouga/LLaMA-Factory.gitcd LLaMA-Factorypip install -e ".[torch-npu,metrics]"# 查看安装的版本llamafactory-cli env 全流程实践原始模型推理cd LLaMA-Factory# 需要提前下载好模型权...

yd_294961020 2025-06-20 10:23:41

823

2025-06-20 10:23:41

823

服务化参数调优实战

服务化性能调优前置准备完成MindIE环境的安装，参考链接下载好要调优的模型权重下载好性能测试数据集调优流程下面以Llama3-8B为例，讲解调优全流程 1.查看模型权重大小Llama3-8B权重为15GB 2.计算npuMemSize计算公式为：Floor[(单卡显存-空闲占用-权重/NPU卡数)* 系数]，系数取值为0.8单卡空闲显存：61GB空闲占用：约3GBnpuMemSize...

昇腾

yd_294961020 2025-04-18 11:47:17

1319

2025-04-18 11:47:17

999+

MindIE Torch快速上手

MindIE Torch整体介绍整体架构推理迁移工作流关键特性特性1：配合torch_npu实现子图+单算子混合执行特性2：支持C++和Python编程特性3：支持TorchScript、ExportedProgram多种模式特性4：支持静态Shape、动态Shape模型编译 MindIE Torch demo开发 MindIE Torch整体介绍整体架构推理迁移工作流 ...

昇腾

yd_294961020 2025-04-17 21:12:10

1566

2025-04-17 21:12:10

999+

DeepSeek-R1-Distill-Qwen-1.5B基于MindIE推理实践

1 实验目标 1.1 实验目标掌握纯模型的精度和性能测试掌握服务化的部署掌握服务化的精度和性能测试 2 前置准备 2.1 准备推理环境 2.1.1 下载镜像1）进入登录昇腾镜像仓库：https://www.hiascend.com/developer/ascendhub查询mindie2）申请权限后，下载对应的镜像版本 2.1.2 拉起容器docker run -itd --privile...

yd_294961020 2025-03-10 17:51:29

1559

2025-03-10 17:51:29

999+

MindIE对接vLLM框架开发指南

vLLM适配昇腾方案参考官方文档：linkvLLM框架在昇腾环境适配的整体方案为上层运行vLLM框架原生的逻辑，包括请求调度、Batch组建、Ray分布式拉起多卡服务等；下层模型推理与后处理通过MindIE LLM提供的GeneratorTorch统一接口接入MindIE模型仓统一进行管理，实现加速库整图模式的模型推理加速。vLLM框架下层模型推理对接Text Generator接口的基本...

昇腾

yd_294961020 2025-01-17 14:47:23

13721

2025-01-17 14:47:23

999+

总条数：11

100

上滑加载中

https://www.baidu.com/s?ie=utf-8&f=3&rsv_bp=0&rsv_idx=1&tn=baidu&wd=sed%20%E6%9B%BF%E6%8D%A2%E5%AD%97%E7%AC%A6%E4%B8%B2&rsv_pq=c7db61a600035dc5&rsv_t=5e19yEsbV9N5fIvdlGRU

快速交付

+ 关注