【云驻共创】大模型时代下的AI开发

举报
福州司马懿 发表于 2024/08/12 00:51:32 2024/08/12
【摘要】 AI发展趋势回顾历史,三次大的工业革命,推动人类社会迈入蒸汽时代、电气时代、互联网时代,每一次革命都深刻改变了世界;人工智能目前看来是人类历史上第四次工业革命,将带给全世界更为深刻的变革,已进入人们生活的方方面面经过几次低谷和高潮后,由于数据获取门槛降低、云计算提供充沛算力,认知计算和生产深度结合,将产生实际巨大经济效益我们正处于AI的起跑线上,每个行业都将被革命。海量分散的小模型会逐步向...

一、AI发展趋势

回顾历史,三次大的工业革命,推动人类社会迈入蒸汽时代、电气时代、互联网时代,每一次革命都深刻改变了世界;人工智能目前看来是人类历史上第四次工业革命,将带给全世界更为深刻的变革,已进入人们生活的方方面面

图片.png

经过几次低谷和高潮后,由于数据获取门槛降低、云计算提供充沛算力,认知计算和生产深度结合,将产生实际巨大经济效益

图片.png

我们正处于AI的起跑线上,每个行业都将被革命。海量分散的小模型会逐步向少数大模型汇聚。OpenAI的报告有提到:未来50%的人类工作任务场景将会被ChatGPT影响

图片.png

随着大模型的诞生,将会对现有的应用进行大范围的重构,成为AI领域应用开发的新范式

图片.png

随着GPT走入我们的视野,大量现象级应用开始涌现,与过去传统的人工智能相比,在文本、图像、多模态等方面都有着质的飞跃

图片.png

华为云也带来了自己的盘古大模型,相信在往后的日子里,也将会重塑千行百业

图片.png

二、大模型相关的基础知识

2.1 什么是AI模型

大模型,简单来说就是预训练时参数规模达到一定量级的模型。
常见的大模型主要包括:大语言模型、CV大模型、多模态大模型、可惜计算大模型等。大模型的特点如下

  1. 应用广泛:大模型语言可用于语言翻译、情感分析、问题答疑等,多模态大模型则可用于进行图片、视频生成等功能
  2. 持续改进:随着越来越多的数据和参数添加进来,性能也会随之提高,功能更强大
  3. 学习很快:可以基于外部的数据参数不断微调学习

2.1.1 AI模型 == 一种函数F:

这个函数将任务的输入映射到相应的输出:

  1. 语音识别:输入一段语音信号,输出文字
  2. 图像识别:输入图片,输出图片的属性
  3. 智能控制:输入棋盘局势,输出下一步
  4. 翻译:输入一种语言,输出对应的翻译
  5. 大模型:输入前文,预测下一个字

2.1.2 如何寻找这个函数?

图片.png
把大象放冰箱一样,一共分为三步

  1. 定义一个函数集合(define a function set)
  2. 判断函数的好坏(goodness of a function)
  3. 选择最好的函数(pick the best one)

2.1.3 AI算法不同的学习方法

  1. 监督学习:由训练资料中学到或建立一个模式,并依此模式推测新的实例
    图片.png
  2. 无监督学习:没有给定先标记过的训练示例,自动对输入的资料进行聚类或分群
    图片.png
  3. 强化学习:与人类学习相似,对作用者的一些动作产生奖励的回馈机制,通过这个回馈机制促进学习
    图片.png

2.2 大语言模型的训练流程

大语言模型的训练过程如下,主要分为:数据搜集、基础大模型训练、指令微调、类人对齐

图片.png

大语言模型的训练要求

  • 大量的数据:图书、网页、论坛、代码(ChatGPT训练需要45TB数据)
  • 合适的算法:Transformers、DeepSpeed、Megation-LM等
  • 充足的算力:据说GPT-3语言模型训练使用了10万个GPU

因此,建议在有限的数据和算力基础下,基于预训练好的模型微调,让模型融入你的数据知识

2.2.1 Scaling Law(大力出奇迹)

Scaling Law:即随着模型规模指数级上升,模型性能实现线性增长。可以根据模型的参数规模、训练数据和训练所使用的算力来预测模型的loss。直到现在,Scaling Law还没有失效,大力出奇迹的趋势还没停止,这也是大模型的参数竞争日趋加大的原因

图片.png
图片.png

大模型参数量计算:模型参数量 ≈ 12 * transformer 层数 * 隐藏维度²

几种主流模型的参数计算示例

图片.png

大模型训练计算量预估:训练计算量(FLOPS) ≈ 8*训练数据集 Token 总量 * 模型参数数量

大模型训练时间预估:训练时间(秒)≈训练计算量/(GPU卡个数 * GPU单卡峰值算力 * GPU卡平均使用率)

Emergent Ablities(涌现现象)

当大模型经过10的22次方浮点运算(实践归纳总结),模型对某些问题的处理性能呈现快速增长,这种现象称为Emergent Abilities,即涌现能力

统计学解释(诺亚):采样定理表明,采样频率达到一个临界值后,数字世界可以真实表现模拟世界,因此大模型参数足够多后(比如大模型语言模拟参数超过百亿),可真实建模自然语言知识

图片.png

大模型能力涌现推翻比例定律

图片.png

2.3 低成本参与大模型的关键技术

2.3.1 大模型高效微调

在面对特定的下游任务时,全参数微调(即与训练模型中的所有参数都进行微调,太过低效率)相比参数高效微调(Parameter-efficient Fine-tuning)方法冻结预训练模型99%以上的参数,仅利用少量下游任务数据微调少于1%模型规模的参数,作为模型插件实现大模型对下游任务的适配,达到媲美全参数微调的性能,并显著降低微调过程的计算和存储开销

图片.png

  • Prefix Tuning/P-Tuning v1/v2:在输入或隐层添加额外可训练的前缀tokens(P-tuning引入连续的prompt),只训练这些前缀参数
  • LoRA/QLoRA:假设大模型微调过程中权重变化具有较低的内在秩,冻结预训练模型权重,通过小参数的低秩矩阵来近似模型权重参数更新
  • Adapter-Tuning:将较小的神经网络或模块(adapter)插入预训练模型的每一层,微调时只训练adapter参数

2.3.2 提示词工程(Prompt Engineering)

Prompt给预训练语言模型一个线索/提示,帮助它可以更好的理解人类的问题。Prompt本质上是对下游任务的指令,可以作为一种信息增强

图片.png

Prompt Engineerine将问题转换为特定格式的输入,并使用预定义的模板、规则和算法来处理,让LLM能够更好地理解任务

图片.png

提示工程是一门相对较新的科学,用于开发和优化提示,以便有效地引导大模型输出合适的结果。

  1. 明确任务
  2. 把指令性文本和上下文分开
  3. 描述要尽量具体
  4. 使用思维链引导模型思考
  5. 使用样例

图片.png

2.3.3 检索增强(Retrieval Augmented Generation,RAG)

大模型存在幻觉、训练语料时效性不足、缺乏领域知识等问题。RAG技术通过接入外部知识库,有助于缓解这些问题,提升大模型内容生成质量、扩展其应用场景

图片.png

RAG查询的步骤如下:

  1. 提出问题
  2. 查询向量数据库
  3. 向量数据库回复
  4. 合成/augmented
  5. LLM查询
  6. LLM恢复/completion

图片.png

三、华为云全栈AI能力

3.1 云全栈AI架构

下图是华为云全栈全场景AI创新,从行业终端,到IP和芯片,再到框架,最后使能应用

图片.png

AI根技术创新包含如下多个方面

图片.png

3.2 华为云EI

全栈全场景产品&服务,助力千行白业智能升级

  1. 昇腾云服务:AI算力底座
  • 基于达芬奇架构,算例大幅提升。
  • 昇腾迁移工具链一键迁移80%代码,降低昇腾上云门槛,提供日志采集工具、问题调测工具、性能分析工具和昇腾编译优化工具
  1. ModelArts:一站式AI开发平台
  • 数据处理/模型训练/应用部署/运维监控,全路打通
  • Standard/Lite/Edge方案,满足全方位需求
  1. 盘古大模型:深度优化的AI根技术
  • 盘古大模型:基于昇腾深度优化,支持千亿参数模型
  • 田筹求解器:面向行业提供运筹优化方案
  • 通用AI:AI原子能力基于大模型全面升级
  1. AIGallery:丰富的AI生态
  • AI Gallery社区与昇腾/昇思社区共建生态、生成共享、互助支持
  • 百模千态专区,支持主流开源大模型,如Stable Diffusion、Llama、ChatGLM…

图片.png

四、华为云AI赋能认证体系

云是ICT产业的未来,也是企业数字化转型的底座,开发者是产业发展的灵魂,是业务创新的源头,是技术发展的引领者。为了更好地服务千万开发者,华为云退出开发者认证,真正让开发者在云上作业,懂开发会开发,与开发者共成长。

4.1 职业认证

华为云提供了如下分级的职业认证

  1. 入门级(HCCDA):核心技术原理、云上开发作业
  2. 工作级(HCCDP):开发需求分析、应用开发构建、应用调测
  3. 专业级(HCCDE):开发需求分析,复杂场景架构设计、应用开发构建、性能优化

图片.png

4.2 华为云开发者认证

华为云开发者认证体系如下

图片.png

4.3 人工智能认证

人工智能的认证体系如下

图片.png

4.4 认证流程

可以是在线按需学习亦或是线下面授培训|理论&实践能力双重检测

图片.png

华为云微认证的网址为:https://activity.huaweicloud.com/certificationindex.html

华为云微认证提供一站式在线学习、实验与考试零基础也可学习前沿技术知识,快速获得场景化的技能提升。

图片.png

众多热门认证,均只需1元即可

图片.png

总结

  1. 人工智能在未来将重构绝大多数行业
  2. 人工智能技术的三要素:算法、算力、数据
  3. 低成本的参与大模型技术研发的方法:高效微调、特征工程、RAG
  4. 华为云的全栈AI根技术:昇腾芯片、异构计算架构CANN、mindspore AI开发框架、modelarts AI应用开发套件
  5. 华为云开发者职业认证分为:入门级(HCCDA)、工作级(HCCDP)、专业级(HCCDE)
  6. 华为云微认证链接:https://activity.huaweicloud.com/certificationindex.html

附录

本文参与华为云社区【内容共创】活动第26期
任务9:大模型时代下的AI开发

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。