InternLM适配Ascend NPU开源开发任务

举报
yd_254538132 发表于 2024/11/19 17:37:36 2024/11/19
【摘要】 InternLM2.5是由InternAI开发的大语言模型,基于 Transformer 架构进行改进,采用了更深层的网络结构和优化的训练策略,提升了模型的推理速度和生成质量。该模型以支持多种自然语言处理任务为目标,包括文本生成、翻译、对话、问答、信息抽取等。拥有卓越的推理能力,在数学推理方面取得了向量级模型最优精度,超越了Llama3;有效支持百万字超长上下文;支持用户可以根据自己的需求通过特定
1. 背景介绍

开源for Huawei(参考:https://developer.huaweicloud.com/programs/opensource/contributing/)  通过和公司、高校、社区的开发者合作,完成鲲鹏、昇腾、欧拉、鸿蒙、高斯、云服务等与开源软件的适配开发,帮助繁荣Huawei的基础生态,同时让开源软件能够更加简单、高效的运行于华为云上。

开始之前,开发者可以下载 开源for Huawei Wiki(参考:https://gitcode.com/HuaweiCloudDeveloper/OpenSourceForHuaweiWiki/overview) 了解详细的开发步骤,技术准备,以及开发过程需要的各种资源。

2需求分析

2.1 项目影响力

InternLM2.5是由InternAI开发的大语言模型,基于 Transformer 架构进行改进,采用了更深层的网络结构和优化的训练策略,提升了模型的推理速度和生成质量。该模型以支持多种自然语言处理任务为目标,包括文本生成、翻译、对话、问答、信息抽取等。拥有卓越的推理能力,在数学推理方面取得了向量级模型最优精度,超越了Llama3;有效支持百万字超长上下文;支持用户可以根据自己的需求通过特定的数据进行微调以适应各种应用场景。

截至 2024  10 月22日,InternLM2.5项目在 GitHub 上的 star 数量已超过 6300fork 数量超过 444,项目的贡献者数目为 58名。最近一次代码提交时间为 2024  10 月。以下是 InternLM2.5 项目的 star 历史图:

image (1).png

2.2 任务目的和范围

本任务的主要目的是将 InternLM2.5 项目适配至华为的 Ascend(昇腾)、Kunpeng(鲲鹏)这些硬件平台上的高效运行,扩展 InternLM2.5 模型的适用场景。这将有助于提升华为在大语言模型领域的竞争力,并增强 Ascend  Kunpeng 处理器的市场影响力。

能力要求:完成该任务需要具备 Python 开发能力,熟悉自然语言处理,熟悉昇腾 NPU、鲲鹏 CPU OpenEuler 操作系统的硬件架构、性能特点和基础配置。

2.3 适配任务清单

生态

生态细类

是否需要验证

验证逻辑说明

是否需要适配

适配场景说明

昇腾生态

指令

使用昇腾处理器运行应用。

使用昇腾指令实现适配逻辑。

CANN

应用功能依赖于CANN运行。

使用CANN实现适配逻辑。

MindSpore

应用功能依赖于MindSpore运行。

使用MindSpore实现适配逻辑。

torch_npu

应用功能依赖于torch_npu运行

使用torch_npu实现适配逻辑

鲲鹏生态

指令

使用鲲鹏处理器运行应用。

使用鲲鹏指令实现适配逻辑。

Euler

使用Euler系统运行应用。

使用Euler系统调用实现适配逻辑。

数据库生态

GaussDB

使用GaussDB功能。

使用GaussDB的驱动和SQL实现适配逻辑。

 

GaussDB(DWS)

使用GaussDBDWS)功能。

使用GaussDB(DWS)的驱动和SQL实现适配逻辑。

存储生态

OBS

使用OBS功能。

基于OBS API访问实现适配逻辑。

鸿蒙生态

HarmonyOS

使用HarmonyOS系统运行应用。

使用HarmonyOS系统调用实现适配逻辑。

 

3. 工作量评估

任务

估计人天

InternLM2.5 在Ascend上的环境配置和测试

15

文档撰写与发布

3

适配新的撰写

2

总计

20

4. 任务分解

4.1DEMO 流程图参考如下:

4.2 完成 InternLM2.5 演示 Demo 的设计、开发和部署

Demo 流程图参考如下:
- 
模型选择:用户通过本地路径选择预训练好的 InternLM2.5 模型。
- 
模型推理:用户输入对话或文本,InternLM2.5  模型根据输入生成对话结果并在界面展示。
- 
适配与优化:确保 InternLM2.5 模型在 AscendKunpeng 处理器及 openEuler 系统上稳定高效运行。
- 提供详细的部署文档,列出步骤,便于用户在AscendKunpengopenEuler环境中复现Demo

 

4.3 完成适配心得输出

撰写一篇详细的适配心得,内容包括InternLM2.5 项目在 Ascend  Kunpeng 处理器上的适配过程、面临的技术挑战、解决方案以及性能优化技巧。心得文档将发布于华为云官方博客或其他技术平台。

 

4.4在华为云开发者论坛输出博客

访问华为云开发者论坛(参考:https://bbs.huaweicloud.com/blogs)发表博客,介绍完成这些任务的过程和心得。

内容包括不限于如下内容:

开源for Huawei的背景

开源软件的功能介绍

开发适配过程及碰到和解决的问题

l DEMO设计、开发、部署过程

代码推送开源社区及互动过程

博客打上如下标签:

开源(必选)

开发者(必选)

l GaussDB数据库(可选)

云数据库 GaussDB(可选)

鲲鹏(可选)

昇腾(可选)

鸿蒙(可选)

对象存储 OBS(可选)

5 验收材料

验收细则

评分说明

是否为验收必选项

结果(通过/不通过)

开发者举证

功能开发:完成与华为三大根技术生态(鲲鹏云、昇腾云、鸿蒙)适配的功能开发

基于鲲鹏、昇腾和Euler系统完成验证。

 

 

代码质量:适配华为三大根技术生态的代码质量经过工具检测达标

推送给开源社区的代码符合开源社区关于代码风格、功能、自动化测试等要求。

 

 

提供相关文档,比如部署文档、使用文档、配置文档等

根据社区要求,完善相关的开发指南和部署指导

 

 

合入到开源项目主仓:代码推送上游社区

代码合并到当前主干分支。举证提供代码仓库链接。

 

 

Deomo设计&开发:完成功能演示Demo的开发

举证提供DEMO前端地址。

 

 

Demo部署&验证:完成功能演示DEMO基于华为昇腾、鲲鹏和Euler系统环境的部署和功能验证

提供DEMO部署验证结果的关键截图进行举证。提供DEMO运行环境和资源的规格清单。

 

 

发布博客:发布博客介绍适配心得。

提供博客的地址。

 

 

制作单机版无高危开源镜像。

上架云商店。

 

 

单机版镜像上架时支持模板部署。

 

 

 

制作集群版无高危开源镜像

上架云商店。

 

 

集群版镜像上架时支持模板部署

 

 

 

 

6. 参考资料

  1. InternLM2.5 仓库: https://github.com/InternLM/InternLM

  2. 华为 Ascend 开发者社区: https://developer.huawei.com/ascend


【版权声明】本文为华为云社区用户原创内容,未经允许不得转载,如需转载请自行联系原作者进行授权。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。