【重磅干货】大模型时代,开发者云上成长指南

举报
华为云社区精选 发表于 2024/03/27 10:15:40 2024/03/27
【摘要】 大模型时代弯道超车,解锁开发者必备4大关键技术。

2024年最热的技术关键词,非大模型莫属。面对这样一个超级“技术网红”,在一切皆可大模型的时代,开发者能否紧跟它的发展步伐,立于技术的潮头显得至关重要。

如何充分利用云上的基础设施,让大模型开箱即用?
如何借助辅助开发工具,让代码编写过程更加高效,事半功倍?
当行业应用遇上大模型,会碰撞出怎样的创意火花?

……

综合权威机构发布的大模型相关的技术趋势洞察,我们精选了四大热门技术方向,并辅之以华为云相关技术服务作为典型案例,帮助开发者厘清大模型时代需要掌握的关键技术, 通过这份大模型开发者成长指南,助力大家在这波技术热潮中先人一步。

AI增强开发——CodeArts Snap写代码事半功倍

当大模型技术应用到软件开发领域,它正在颠覆传统的软件工程,在Gartner的2024技术趋势报告中,提到了AI增强开发,它指的是用生成式AI、机器学习等AI技术协助软件开发人员精选应用设计、编码和测试。

CSDN发布的《AI开发者生态报告》中提到,近90%的开发者已经使用代码生成工具; 其中,35%的开发者每天都使用代码生成工具。

毋庸置疑,大模型正在开启软件开发的新范式,尤其是在自动化方面,基本上超越了传统工具,为软件研发效率的提升带来质的变化。编程和应用开发的门槛逐渐降低,应用开发能力便捷逐渐扩展,全民开发者的时代正在来临。

但与此同时,由于生成的内容难以限制,一些“不安全”或者“不应该”出现在生成结果中的代码会出现在生成结果中,导致市场上各AI辅助编程工具质量不一。

源于华为自身的研发实践,华为云基于大模型技术,学习了1300多万篇经典的技术文档、760亿行精选代码,打造了智能开发助手CodeArts Snap。

它基于智能生成和智能问答两大核心场景提供了支持多种主流IDE的插件,覆盖代码生成、研发知识问答、单元测试用例生成、代码解释、代码注释、代码翻译、代码调试、代码检查等八大研发场景。

CodeArts Snap的代码生成,就像一位聪明的机器人,开发者在编写重复性代码、快速原型开发等多个场景中只需输入自然语言,就能生成完整代码逻辑,并准确率最佳。它的代码解释专治开发者的“阅读困难症”,无论是学习新编程语言、分析他人代码,还是优化代码、故障排除,即可将代码复制黏贴到工具中,实现快速分析代码并自动生成详细的解释文档。

灵感到代码只需“弹指间”即可实现。

华为云CodeArts Snap的“全场景代码智能生成”能力,其核心技术沉淀于华为云PaaS技术创新Lab与华为诺亚方舟实验室联合打造的PanGu-Coder代码大模型中。比如,针对函数级的代码生成与补全任务,CodeArts Snap分别发布了参数量为3亿和26亿两个规模可用的生成功能。当给定函数名并用自然语言描述需要实现的功能后,模型即可生成完整的函数功能代码。

同时,CodeArts Snap在各阶段均采取了针对性措施,有效规避了业界产品普遍带来的编程安全隐患。例如为避免开源代码带来的系统性风险,在数据预处理阶段,预训练数据对可能产生问题的licence涉及的代码进行了精细的过滤,从根本上杜绝开源licence风险。

Codearts Snap现在已经开启了公测,已经有一些开发者在华为云开发者社区分享了他们的👉 体验心得,也欢迎开发者👉 前来体验

行业大模型——盘古大模型让企业开发者更高效

垂直领域应用是大模型的主战场。随着生成式AI技术的飞速发展,各行各业都将迅速整合大模型的能力创造全新的应用,催生出全新的商业价值。

华为云盘古大模型正式对外发布以来,也一直颇受关注,盘古大模型提供5个基础大模型(自然语言、视觉、多模态、预测、科学计算)+N个行业大模型+X个场景模型的三层解耦架构, 天然具备良好的生态开放性,通过分层的AI能力及工具,成就不同行业开发者百模千态的需求。

其中,华为云L0盘古基础大模型提供100多个能力集,各项能力集互相解耦,可以通过API直接调用。企业开发者可以根据业务场景需要,选择所需的能力集,使用盘古大模型工作流,快速开发行业场景应用。也可以在L0或L1盘古大模型的基础上,通过对自有数据的二次训练快速训练出自己专属的行业大模型。

为了加速和简化行业大模型从开发到落地,华为云还提供了盘古大模型工程套件,包括数据工程、模型开发和应用开发三大套件, 基于此,完成一个千亿行业模型端到端开发,从过去需要5个月缩短到现在1个月,整体速度提升5倍。

在气象领域,华为云盘古气象大模型已正式上线欧洲中期天气预报中心和香港天文台地球官网,并携手深圳市气象局、泰国国家气象局等打造高精度区域气象预报大模型,利用人工智能技术提升气象灾害预警能力。在2023年汛期,盘古气象大模型成功预测了玛娃、泰利、杜苏芮、苏拉等强台风路径。

除此之外,盘古大模型在医疗行业的落地,让医生为患者提供更高效的健康管理服务;在电商行业智能化生成产品文案、广告创意,让跨境电商的生意更好做……

开发者可以👉 点击链接前往申请体验试用盘古大模型。

向量数据库——GaussDB向量数据库是大模型的超级“外脑”

大模型时代,为了支持模型的高效运行,开发者需要掌握云原生基础设施技术。这波汹涌而来的大模型浪潮,也必然会催生基础设施的革新,其中最具有代表性的就是数据库的升级。

基于海量数据训练而来的大模型,往往会遇到一些令人啼笑皆非的问题,比如对不知道的知识一本正经的胡说八道,或因为训练的时间的滞后导致无法获取到最新实时的知识,从而给出过时的答案。

面对大模型在训练过程中出现的准确性和实时性难题,向量数据库是最佳的选择。它是一种专门用来处理向量嵌入(Vector Embedding)的数据库,通过比较向量值并找到彼此相似的值来索引和检索数据,适用于处理如文档、图像、视频和网页等非结构化数据。

如果把大模型比作人的大脑,那么向量数据库就如同大模型的“外脑”。

  • 在实时性方面,向量数据库可满足秒级甚至毫秒级数据更新的需求,解决大模型预训练或微调都需要天甚至月级以上时间,导致知识库新鲜度相对滞后的问题,减少大模型的“幻觉”。

  • 在隐私性方面,通过向量数据库本身的权限控制,能真正实现隐私数据自主可控不出端。只需使用通用大模型外挂向量数据库,即可解决私有数据注入大模型带来的安全和隐私问题。

  • 在上下文限制方面,向量数据库具备历史数据持久化的能力,同时持久化的数据可以通过内置的ANN算法做相似性查询,返回最相关内容,从而突破大模型上下文限制,实现长期记忆。

华为云在向量数据库和DB4AI领域积累颇深,从2018年开始就启动以图搜图项目,储备了相关技术,并于2023年正式对外发布华为云GaussDB向量数据库。

GaussDB向量数据库结合语义Embedding技术,能基于客户实际的文档和规范回答问题,结果更准确。并且可以将已推理过的问题进行缓存,当相同问题再出现时,不需要经过大模型推理即刻返回结果,大幅减少算力成本。

与业界主流向量数据库相比,GaussDB向量数据库具备千亿级大规模向量数据快速查询更新的能力,检索规模提升10倍;内置ANN-Benchmark榜单性能排名第一的华为ANN索引算法,查询时延<10ms,响应速度提升2倍;且具有千维查询能力,查询结果更精准。

当前,已使用GaussDB数据库的开发者可以通过升级体验GaussDB向量数据库的所有功能,实现无感知式扩容和一站式部署,降低学习和部署成本。同时,GaussDB数据库生态成熟、社区活跃,相关的工具和扩展十分成熟可靠,👉 点击链接前往让向量数据库的使用无后顾之忧。

AI算力——昇腾AI云服务助力开发者落地大模型应用

根据CSDN发布的《AI开发者生态报告》调查,除了大模型技术,生成式AI、算力也是开发者最关注的技术突破方向之一。

算力是训练大模型的基础,大模型的涌现,使得AI算力的需求出现指数级的增长。研究表明,大参数量、大数据量、大计算量已经成为大模型表现好的主要因素。

在infoq发布的《中国软件技术发展洞察和趋势预测研究报告》中,提到了云forAI新阶段:在AI模型训练和应用生成的过程中,更要充分利用云的资源弹性,对异构算力的便捷管理能力等技术手段,提供工程高效率、成本可观测、弹性可预测、结果可复制的AI模型生成流水线。

为支持百模千态稳健发展,华为云在贵安、乌兰察布、芜湖3大AI算力中心上线了昇腾AI云服务,让AI算力即开即用。

华为云昇腾AI云服务支持万亿级参数大模型分布式并行训练,大幅提升训练效率;提供更长稳的AI算力服务,千卡训练30天不中断,长稳率达到90%,断点恢复时长不超过10分钟;提供盘古大模型100+能力集、100+内化后的开源大模型,让大模型开箱即用。

为了释放昇腾硬件算力,昇腾AI异构计算架构CANN发布更开放、更易用的CANN 7.0版本, 全面兼容业界的AI框架、加速库和主流大模型,同时通过大颗粒算子深度融合、Kernel调度策略优化、通信并发流水等技术手段,解决大模型训练核心问题,使能大模型性能深度优化。

同时升级昇腾Ascend C编程语言,提供大模型融合算子开发能力,可支撑周级完成大模型典型融合算子开发,性能同比单算子提升5倍以上。Ascend C遵循C/C++标准规范,并通过编译器编译和运行时调度,直接运行在昇腾系列硬件,可高效实现自定义创新算法。

Ascend C四大技术优势

为了让开发者能够更加便捷地将AI算力应用实践到各种创新场景,华为联合香橙派发布了基于昇腾的Orange Pi AIpro, 提供8/20TOPS算力,能覆盖生态开发板者的主流应用场景。满足大多数AI算法原型验证、推理应用开发的需求,可适用于AI边缘计算、深度视觉学习及视频流AI分析、视频图像分析、自然语言处理、智能小车、智能家居等领域,👉 点击链接前往快速上手Orange Pi AIpro。

当前,华为云的AI Gallery社区已经聚合数据集、模型、实践3大类等10万+AI资产,其中的昇腾AI云服务“百模千态”专区,提供基于异腾AI云服务适配的业界主流开源大模型, 易用开发工具和超强算力,丰富的应用开发工具链已经全部实现了云化,免去繁琐的配置流程,实现一键接入,即开即用助力开发者快速创建模型应用,👉 点击链接前往

最后

大模型的涌现,我们得以窥见技术的无限潜能。它不仅在实际应用中显著提升了开发者的工作效率,也预示着通用人工智能时代的迫近。“工欲善其事,必先利其器”,在技术奇点即将来临的时刻,开发者们更应深入理解与其相关的前沿技术,华为云将持续助力企业和开发者创建自己的大模型应用,在大模型时代先人一步。

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。