说吧,盘古你凭什么获奖?
近日,在苏州召开的
第四届全球人工智能产品应用博览会上
华为云盘古大模型荣获“智博会产品金奖”
“智博会产品金奖”
是博览会的重磅奖项
盘古大模型究竟是何方神圣
拥有什么突破性技术创新
有哪些可落地的应用实践
能脱颖而出获此殊荣?
让我们跟随主持人乐乐和小易
近距离了解一下
什么是盘古大模型?
今年4月,华为云发布了盘古系列超大预训练模型,具有超大规模参数、超高精度的特质,让AI开发模式从手工作坊式升级到工业化开发新模式,以减少行业侧的数据标注依赖,从而降低人工智能开发的门槛和成本,目前包括“四大分身”:
文本大模型 (NLP)
重点在于文本的理解和生成能力,可以理解文字背后的含义,从文本中抽取关键信息,例如从法律文书中快速找出案件要素,提高判决效率,也可以辅助人类写作;
视觉大模型 (CV)
重点在于视觉理解的能力,可以对各行业的图像进行识别和检测,例如快速找出工业产品的缺陷,提高质检效率;
多模态大模型
重点在于图像和文本的跨模态理解与生成能力,可以根据给定的文本生成图像,也可以根据给定的图像生成文本,可以帮助人类提高产品设计和艺术创作的效率;
科学计算大模型
目标是帮助人类解决各种科学问题,如气象预测、海浪预测、分子动力学预测、微分方程求解等,用AI技术来促进基础科学的发展。除了这四大能力外,华为云也在积极探索大模型在其他方向的应用,如3D点云、神经渲染等,未来会将大模型应用在更多方面。
为什么开发盘古大模型?
当前业界大部分人工智能开发者,正在沿用传统的“小作坊模式”,即针对每个场景,独立地完成模型选择、数据处理、模型优化、模型迭代等一系列开发环节。
由于无法积累通用知识,同时不同领域的调试方法有所不同,这样的开发模式往往比较低效。特别地,当前人工智能领域存在大量专业水平不高的开发者,他们往往不能掌握规范的开发模式和高效的调优技巧,从而使得模型的精度、性能、可扩展性等指标都不能达到满意的水平。
盘古大模型将改变传统的“小作坊开发模式”,走向新的“工业化开发模式”,将一套通用的流水线复用到各种不同的场景里去,减少专家的干预和人为调优的消耗,从而降低人工智能开发的门槛和成本。
盘古大模型有哪些突破性技术创新?
过去两年,盘古大模型获得了10多个业界挑战赛冠军,30多个专利申请,发表了70多篇IEEE、ACM期刊论文,以及120多篇CCF A类会议论文。
盘古大模型的开发过程中首次采用了多项领先技术,如:
● 首次在图像预训练流程中加入生成和判别损失,兼顾CV大模型的判别能力和生成能力,保证模型在底层图像恢复和高层语义理解的能力。
● 首次在文本预训练模型中使用Encoder-Decoder架构,兼顾NLP大模型的理解能力和生成能力,保证模型在不同系统中的嵌入灵活性。
● 在对比度自监督学习中引入了样本相似性,使得小样本学习的能力获得了显著提升,达到业界第一。
● 采用“阶段式训练”和“动态冰化”策略,显著提升大模型训练的稳定性和效率,仅需少量样本和可学习参数即可完成千亿规模大模型的快速微调和下游适配。
盘古大模型有哪些落地的应用实践?
盘古预训练大模型已经在多个行业场景成功验证,包括能源、零售、金融、工业、医疗、环境、物流等等。
● 在国网重庆永川公司落地的无人机智能巡检项目中
盘古大模型帮助电力部门,减轻了大量人工,还提高了巡检的效率。以前训练一个模型要人工标注上万张图片,现在只需要几十张;以前模型开发要一个物品识别一个模型,现在一个大模型就可以完成大量物品的识别。
● 在实时海浪预测项目中
传统科学计算模型在预测海浪高度变化的时候,需要消耗海量的超算算力。基于盘古科学计算大模型,在保证准确率的前提下,将预测速度提升到了原来的10,000倍,极大地提升了预测的时效性。
可见,盘古大模型已支撑起城市各行各业多种多样的创新和智能应用,成为了名副其实的城市数字化转型的智能基础设施。
总结而言,华为云盘古大模型实现了一个AI大模型在众多场景通用、泛化和规模化复制,减少了对数据标注的依赖,让AI开发由作坊式转变为工业化开发的新模式,节约研发成本。
同时,盘古大模型还提供模型预训练、微调、部署和迭代的功能,形成了AI开发完整闭环,极大地提升了AI开发效率。缩短了传统行业走向智能化的距离,赋能千行百业迈向智能化的星辰大海。
- 点赞
- 收藏
- 关注作者
评论(0)