吴恩达机器学习——多元梯度下降法与正规方程求解

举报
KevinQ 发表于 2022/01/18 11:24:18 2022/01/18
【摘要】 多元梯度下降法技巧正确的学习率α能够使代价函数J,每次迭代后J都下降。画出代价函数随迭代步数增加的变化曲线。通过看这种曲线来判断梯度下降算法是否收敛。这种图还能看到算法有没有正常工作。因此,在进行梯度下降时,总是绘制代价函数随迭代的变化曲线,观察算法是否有效。如果算法不正常工作,最简单的方法:使用更小的学习率(数学上已经证明,足够小的学习率能够使代价函数每次迭代都减小)(如果学习率太小,收...

多元梯度下降法技巧

正确的学习率α能够使代价函数J,每次迭代后J都下降。画出代价函数随迭代步数增加的变化曲线。通过看这种曲线来判断梯度下降算法是否收敛。这种图还能看到算法有没有正常工作。

因此,在进行梯度下降时,总是绘制代价函数随迭代的变化曲线,观察算法是否有效

image-20220118104930190

如果算法不正常工作,最简单的方法:使用更小的学习率(数学上已经证明,足够小的学习率能够使代价函数每次迭代都减小)(如果学习率太小,收敛速度会减慢)

image-20220118105017779

寻找学习率的方法:从小开始,逐步3倍增加,接近最大值得时候,取一个小一点儿的值。

image-20220118105032119

特征与多项式回归

通过定义新特征,你可能会得到一个更好的模型。(例如,直接给定的数据是房子的宽度,长度/深度,我们计算出新的特征值为面积)

image-20220118105113399

多项式回归与线性回归的一致性,以及特征缩放更加重要。

image-20220118105157311

可以自己选择所要拟合的函数:

image-20220118105231495

正规方程

正规方程直接求解最优θ(不需要做特征缩放)

image-20220118105323351

梯度下降需要迭代获取到最优值;正规方程能够直接计算出最优值。

image-20220118105342066

求解各个偏导数为0的方程组。

image-20220118105354794

image-20220118105402482

选择使用梯度下降还是正规方程?

特征值变量的数据决定选择梯度下降还是正规方程。(很难给出确切的临界数字,一般10000以上的特征变量就开始考虑使用梯度下降算法。)

正规方程的算法复杂度是O(n3),n为特征值数量。

image-20220118105517576

正规方程在矩阵不可逆情况下的解决办法

XT*X不可逆的原因:

  1. 存在多余特征(存在线性相关的特征)

  2. 特征太多: m<=n 表示样本数量小于特征数量(解决方法:删除多余特征或正规化 regularization)

    image-20220118105828937

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。