OLMo适配昇腾开源验证任务

举报
阳煦~ 发表于 2024/12/06 10:13:43 2024/12/06
【摘要】 OLMo(Open Language Model)是由Allen AI(AI2,艾伦人工智能研究所)开发的一个完全开源开放的大型语言模型(LLM)框架,设计初衷是为了通过开放研究,促进学术界和研究人员共同研究语言模型的科学。OLMo框架提供了一系列的资源,包括数据、训练代码、模型权重以及评估工具,以便研究人员能够更深入地理解和改进语言模型

1. 背景介绍

开源for Huawei(参考:https://developer.huaweicloud.com/programs/opensource/contributing/)
通过和公司、高校、社区的开发者合作,完成鲲鹏、昇腾、欧拉、鸿蒙、高斯、云服务等与开源软件的适配开发,帮助繁荣Huawei的基础生态,同时让开源软件能够更加简单、高效的运行于华为云上。
开始之前,开发者可以下载 开源for Huawei Wiki(参考:https://gitcode.com/HuaweiCloudDeveloper/OpenSourceForHuaweiWiki/overview)
了解详细的开发步骤,技术准备,以及开发过程需要的各种资源。

2. 需求分析

2.1 开源软件基本情况

OLMo(Open Language Model)是由Allen AI(AI2,艾伦人工智能研究所)开发的一个完全开源开放的大型语言模型(LLM)框架,设计初衷是为了通过开放研究,促进学术界和研究人员共同研究语言模型的科学。OLMo框架提供了一系列的资源,包括数据、训练代码、模型权重以及评估工具,以便研究人员能够更深入地理解和改进语言模型。

官方项目主页:https://allenai.org/olmo
GitHub代码库:https://github.com/allenai/olmo
主要开发语言:Python
LICENSE:Apache License
维护者:Allen AI
项目数据:Fork 488, Star 4.8K, Contributor 40,最近一次提交:2024-11-28

star历史(https://star-history.com/):

2.2 任务目的和范围

本任务的主要目的是让OLMo在Ascend NPU上高效运行,确保项目在平台上具备良好的兼容性和性能,扩大其在AI和深度学习领域的竞争力和影响力。

能力要求
完成该任务需要具备大模型开发经验,掌握linux常用命令,熟悉模型推理对应的工作流程及其性能调优,理解编译器的基础知识,并且了解昇腾和鲲鹏处理器的架构和部署。开发过程中主要使用Python语言,

适配任务清单

生态 生态细类 是否涉及 验证逻辑说明 是否需要适配 适配场景说明
昇腾生态 指令 使用昇腾处理器运行应用 使用昇腾指令实现适配逻辑
CANN 应用功能依赖于CANN运行 使用CANN实现适配逻辑
MindSpore 应用功能依赖于MindSpore运行 使用MindSpore实现适配逻辑
鲲鹏生态 指令 使用鲲鹏处理器运行应用 使用鲲鹏指令实现适配逻辑
Euler 使用Euler系统运行应用 使用Euler系统调用实现适配逻辑
数据库生态 数据库驱动 使用GaussDB功能 使用GaussDB数据库驱动实现适配逻辑
GaussDB(DWS) 使用GaussDB(DWS)功能。 基于GaussDB ORM框架实现适配逻辑。
存储生态 使用OBS对象存储 使用OBS功能。 基于OBS API访问实现适配逻辑。
鸿蒙生态 HarmonyOS 使用HarmonyOS系统运行应用 使用HarmonyOS系统调用实现适配逻辑

3. 工作量评估

3.1 工作量评估

任务

人/天

在昇腾、鲲鹏处理器和欧拉操作系统上的环境配置与测试 4
完成DEMO设计和功能验证 3
撰写详细步骤文档并发布 2
输出心得博客 2
总计 11人天

4. 任务分解

4.1 完成演示DEMO设计、开发

参考:https://github.com/allenai/olmo页面的模型推理,完成相关功能的验证。

4.2 DEMO设计和功能验证

  • 环境准备:管理和解决项目依赖问题,配置适当的网络策略和安全组规则,确保DEMO流程可以在Ascend NPU上顺利进行。
  • 代码适配:将OLMo项目的代码迁移至搭建好的环境并进行必要的修改和适配,测试并确保项目功能完整。
  • DEMO内容:使用自己创建的run.py文件对模型OLMo-7B测试,确保可以支持文本补全功能,并通过gradio构建一个简单的Web应用界面展示DEMO效果。
  • 文档撰写:写出文档列出详细的步骤并通过开源平台进行发布,旨在确保即便是初学者也能跟随并成功复现结果。

4.3 在华为云开发者论坛输出博客

访问华为云开发者论坛(参考:https://bbs.huaweicloud.com/blogs)发表博客,介绍完成这些任务的过程和心得。

内容包括不限于如下内容:

l 开源for Huawei的背景

l 开源软件的功能介绍

l 开发适配过程及碰到和解决的问题

l DEMO设计、开发、部署过程

博客打上如下标签:

l 开源(必选)

l 开发者(必选)

l 鲲鹏(可选)

l 昇腾(可选)

l Euler(可选)

5. 验收材料

验收细则 评分说明 是否为验收必选项 结果(通过/不通过) 开发者举证
功能开发:完成与华为三大根技术生态(鲲鹏云、昇腾云、鸿蒙)适配的功能开发 基于Ascend NPU完成验证。
代码质量:适配华为三大根技术生态的代码质量经过工具检测达标 推送给开源社区的代码符合开源社区关于代码风格、功能、自动化测试等要求。
提供相关文档,比如部署文档、使用文档、配置文档等 根据社区要求,完善相关的开发指南和部署指导。
合入到开源项目主仓:代码推送上游社区 代码合并到当前主干分支。举证提供代码仓库链接。
Deomo设计&开发:完成功能演示Demo的开发 举证提供DEMO前端地址。
Demo部署&验证:完成功能演示DEMO基于华为昇腾、鲲鹏和Euler系统环境的部署和功能验证 提供DEMO部署验证结果的关键截图进行举证。提供DEMO运行环境和资源的规格清单。
发布博客:发布博客介绍适配心得。 提供博客的地址。
制作单机版无高危开源镜像。 上架云商店。
单机版镜像上架时支持模板部署。
制作集群版无高危开源镜像 上架云商店。
集群版镜像上架时支持模板部署

参考资料
开源for Huawei介绍、环境搭建、示例项目、开发和部署指南:https://gitcode.com/HuaweiCloudDeveloper/OpenSourceForHuaweiWiki/overview
华为昇腾社区首页:https://www.hiascend.com/developer
华为鲲鹏社区首页:https://www.hikunpeng.com/developer
华为欧拉社区首页:https://www.openeuler.org/

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。