【愚公系列】《人工智能70年》048-生成式Al的辉煌与难题(人人都有大模型)

举报
愚公搬代码 发表于 2025/11/22 17:19:36 2025/11/22
【摘要】 💎【行业认证·权威头衔】✔ 华为云天团核心成员:特约编辑/云享专家/开发者专家/产品云测专家✔ 开发者社区全满贯:CSDN博客&商业化双料专家/阿里云签约作者/腾讯云内容共创官/掘金&亚马逊&51CTO顶级博主✔ 技术生态共建先锋:横跨鸿蒙、云计算、AI等前沿领域的技术布道者🏆【荣誉殿堂】🎖 连续三年蝉联"华为云十佳博主"(2022-2024)🎖 双冠加冕CSDN"年度博客之星TOP...

在这里插入图片描述

💎【行业认证·权威头衔】
✔ 华为云天团核心成员:特约编辑/云享专家/开发者专家/产品云测专家
✔ 开发者社区全满贯:CSDN博客&商业化双料专家/阿里云签约作者/腾讯云内容共创官/掘金&亚马逊&51CTO顶级博主
✔ 技术生态共建先锋:横跨鸿蒙、云计算、AI等前沿领域的技术布道者

🏆【荣誉殿堂】
🎖 连续三年蝉联"华为云十佳博主"(2022-2024)
🎖 双冠加冕CSDN"年度博客之星TOP2"(2022&2023)
🎖 十余个技术社区年度杰出贡献奖得主

📚【知识宝库】
覆盖全栈技术矩阵:
◾ 编程语言:.NET/Java/Python/Go/Node…
◾ 移动生态:HarmonyOS/iOS/Android/小程序
◾ 前沿领域:物联网/网络安全/大数据/AI/元宇宙
◾ 游戏开发:Unity3D引擎深度解析

🚀前言

无所不能的 ChatGPT,使人们对大语育模型的通用能力有了全新认识。

在这里插入图片描述

🚀一、人人都有大模型

随着大模型应用日益普及并深入各行各业,如何让大、中、小型机构乃至家庭与个人都能高效使用甚至自主部署大模型,已成为关键问题。端侧大模型(即部署并运行于终端设备的大模型)正是应对这一挑战的重要方向。随着大模型技术及硬件性能的快速提升,在终端设备本地运行大模型已成为可能。

传统大模型因规模庞大、算力需求高,通常部署在云端或数据中心服务器中。然而,随着应用规模扩大,云端推理成本随日活用户数及使用频次急剧上升,网络延迟、数据安全与隐私保护等问题也逐渐凸显,限制了大模型的规模化推广。因此,将大模型部署至终端设备——如智能驾驶电动汽车、物联网设备、智能手机、平板电脑、个人计算机、机器人、智能家居、可穿戴设备及医疗健康终端等,展现出广阔的应用前景,并迅速成为行业热点。

实现端侧大模型的关键,在于提升终端芯片的算力以支持复杂机器学习任务,同时依赖轻量化模型技术,使大模型能够在资源受限的设备中高效运行。目前主流的轻量化技术包括模型量化、剪枝、知识蒸馏和参数共享等。这些方法通过减少参数量、优化结构等方式降低模型复杂度和计算开销,同时尽可能保留原模型的性能:

  • 模型量化:将高精度参数(如浮点数)转换为低精度格式(如整型),以减少存储占用并提升计算效率;
  • 模型剪枝:识别并移除对模型输出贡献较小的参数或连接,实现模型压缩与推理加速;
  • 知识蒸馏:将大型“教师模型”的知识迁移到轻量“学生模型”中,通过模仿输出提升小模型性能;
  • 参数共享:在神经网络不同层或神经元间复用相同参数,减少冗余并保持模型能力。

尽管轻量化可能带来轻微的性能损失,但它使大模型得以有效部署于终端设备,是一种合理的权衡策略。

看好端侧大模型的发展,多家科技巨头已积极布局。具备芯片与模型技术双重能力的公司推出了端侧AI全栈解决方案,如谷歌的 TensorFlow Lite 框架与 Edge TPU 芯片、苹果结合 Core ML 框架与 A 系列芯片的平台,以及微软通过 ONNX 框架与高通骁龙芯片实现的跨平台方案。

芯片企业也纷纷推出支持端侧AI的处理器,如高通骁龙AI引擎、AMD 锐龙AI 300系列移动处理器及9000系列桌面处理器、华为达芬架构NPU等,这些芯片支持终端设备本地独立执行图像识别、语音处理等复杂AI任务,减少对云端的依赖。

同时,开发大模型的科技公司相继发布轻量化模型,例如谷歌的MobileBERT参数量仅原版BERT的1/4,商汤与阿里发布的端侧大模型也仅18亿参数,均可在移动设备中高效运行。

作为全球最大的智能终端生产基地,中国在端侧大模型的应用方面具有显著优势与广阔前景。未来,每个人都将在各类终端设备上使用属于自己本地的、高效且安全的大模型。

【声明】本内容来自华为云开发者社区博主,不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。