【愚公系列】《人工智能70年》012-深度学习成功的秘密(不是只要算法好就能成功)

💎【行业认证·权威头衔】
✔ 华为云天团核心成员:特约编辑/云享专家/开发者专家/产品云测专家
✔ 开发者社区全满贯:CSDN博客&商业化双料专家/阿里云签约作者/腾讯云内容共创官/掘金&亚马逊&51CTO顶级博主
✔ 技术生态共建先锋:横跨鸿蒙、云计算、AI等前沿领域的技术布道者
🏆【荣誉殿堂】
🎖 连续三年蝉联"华为云十佳博主"(2022-2024)
🎖 双冠加冕CSDN"年度博客之星TOP2"(2022&2023)
🎖 十余个技术社区年度杰出贡献奖得主
📚【知识宝库】
覆盖全栈技术矩阵:
◾ 编程语言:.NET/Java/Python/Go/Node…
◾ 移动生态:HarmonyOS/iOS/Android/小程序
◾ 前沿领域:物联网/网络安全/大数据/AI/元宇宙
◾ 游戏开发:Unity3D引擎深度解析
🚀前言
深度学习诞生时的环境,是辛顿的坚持获得成功的基础。

🚀一、不是只要算法好就能成功
深度学习之所以能够迅速崛起并成为主导人工智能的关键技术,除了在思想与算法上的重大突破之外,还离不开其所处的算力与数据环境的成熟。可以说,深度学习“生逢其时”,命运终于向坚持数十年的辛顿展现了微笑。
深度学习是机器学习(Machine Learning, ML)的一个重要分支,而机器学习作为人工智能领域中的一门交叉学科,其历史与AI本身一样悠久。机器学习的核心目标,是使计算机能够通过数据自动学习规律并解决实际问题。实现机器学习有多种途径,深度学习——即以深度神经网络(Deep Neural Networks, DNN)为代表的方法——正是其中影响最为深远的一种。
它们之间的关系可简要概括为:
AI是目标,机器学习是实现途径,深度学习是具体方法。
虽然机器学习与人工神经网络并非全新概念,深度学习在严格意义上也可追溯至早期研究,但2006年由辛顿等人重新提出时,确实带来了一系列创造性的新思路与算法,使机器学习焕发全新活力。然而AI发展史表明,仅靠优秀算法并不足以成功。例如,深度学习采用统计学方法高效处理神经网络中的权重,对概率较高的近似数据进行合并,显著降低了数据维度与系统复杂度。正是凭借这项关键突破,辛顿将其提出的网络结构称为“深度置信网络”(Deep Belief Network)。但即便如此,其所涉及的数据量与计算规模依然十分庞大。
人工神经网络模仿人脑结构,通过“学习”获取知识并解决问题。最初的单层网络显然无法满足实用需求。随着认知科学的发展,研究者开始在输入层与输出层之间引入“隐藏层”,形成三层网络结构。隐层可进一步增加至几层、几十甚至数百层——2015年ImageNet冠军、微软的ResNet系统已达到152层,而如今上千层的深度网络也已成为现实。
随着网络层数加深,模型能够逐层提取更抽象的特征,“深度”因而成为这一技术的关键特点,甚至常被用作深度学习的代名词。然而,“深度”也意味着复杂度的急剧上升与计算需求的大幅增加。
与人类学习类似,机器学习同样需依赖“学习材料”——即数据。它可分为“监督学习”(使用标注数据)和“无监督学习”(使用未标注数据)。人工神经网络作为一个典型的数据驱动模型,需通过大量数据训练不断调整参数,使模型达到“收敛”,从而实现良好的推断能力。这一过程被称为“训练”。
通常,一个人工神经网络系统需使用三个数据集:训练集、开发集与测试集。训练集规模越大、质量越高,模型表现就越好。若训练数据不足,模型易发生“过拟合”——即仅适用于训练数据,却缺乏泛化能力。而泛化能力才是衡量智能的关键。
正如人类举一反三依赖于广泛的知识积累,机器学习同样需要大量多样化数据。形象地说,“喂”给模型的数据越多、质量越高,其表现就越出色。当前炙手可可热的“大模型”,正是这一理念的极致体现。
为降低对监督学习的依赖、提升训练效率,辛顿提出了融合无监督与监督学习的训练策略:先通过无监督学习进行逐层预训练,为网络参数找到较优初始状态;再使用标注数据进行监督学习,完成整体优化。他生动地比喻道:“孩子学认牛时,并不需要看上百万张带‘牛’标签的图片——他们自己看,自己问,妈妈答一句‘这是牛’,他们就学会了。”
尽管方法巧妙,深度学习的真正爆发仍依赖于两大外部条件的成熟:强大的计算能力与海量数据资源。
此外,为提高模型在复杂环境中的稳定性——即“鲁棒性”(Robust),常需在训练中人为添加噪声,以提升系统应对干扰的能力。这好比士兵在恶劣环境中训练以增强实战能力,但这也进一步加大了对算力和数据量的要求。
正如日本人工智能学会伦理委员松尾丰所评价的,深度学习是AI领域“五十年来的一次重大飞跃”。而若要支撑这只“雄鹰”高飞,则离不开两只坚强的翅膀:强大算力与高质量大数据。而正是在这两方面,两位华人学者做出了里程碑式的贡献:他带来了GPU(图形处理器)的强大并行计算能力,她构建了ImageNet大型图像数据集——它们共同为深度学习的崛起奠定了不可或缺的基石。
- 点赞
- 收藏
- 关注作者
评论(0)