- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

【机器学习】梯度下降之数据标准化

计算机魔术师发表于 2022/08/28 19:23:58 2022/08/28

【摘要】 🤵‍♂️ 个人主页: @计算机魔术师👨‍💻 作者简介：CSDN内容合伙人，全栈领域优质创作者。🌐 推荐一款找工作神器网站: 牛客网🎉🎉|笔试题库|面试经验|实习招聘内推还没账户的小伙伴速速点击链接跳转牛客网登录注册开始刷爆题库，速速通关面试吧🙋‍♂️该文章收录专栏✨— 机器学习 —✨@toc@[toc]吴恩达机器学习学习笔记，看完文章大概需要三分钟一、问题分析在线...

🤵‍♂️ 个人主页: @计算机魔术师
👨‍💻 作者简介：CSDN内容合伙人，全栈领域优质创作者。

🌐 推荐一款找工作神器网站: 牛客网🎉🎉|笔试题库|面试经验|实习招聘内推
还没账户的小伙伴速速点击链接跳转牛客网登录注册开始刷爆题库，速速通关面试吧🙋‍♂️

该文章收录专栏
✨— 机器学习 —✨

@toc

@[toc]

吴恩达机器学习学习笔记，看完文章大概需要三分钟

一、问题分析

在线性回归中，尤其是多变量回归模型，由于各个的数据之间量化纲位不同，如果数
据范围分别是是【0~1000，0 ~5】或者【-0.00004 ~ 0.00002，10 ~ 30】, 那么在使用梯度下降算法时，他们的等高线是一个又窄又高的等高线，如下图：

因为一个他们量化纲位不同会出现（1，299），（3，800）这种特征实例，那么等高线就会又窄又高，在梯度下降算法中，参数更新就会如上图左右震荡，如果等高线如下图，参数更新就能更快收敛与更新了

二、3D可视化

如下图：代价函数（就是回归模型的预测值和实际值的差的平方和）的3D图，就像下山一样，为了达到局部最优点或全局最优点，作为下山者，你肯定希望地形比较平缓，比较清楚的知道往哪里走能够最快下山，而如果这个山又陡又窄，那下山者是不是下山肯定速度慢很多，往哪里都是下降，不能准确找到方向。

理想的代价函数

但实际往往都是下图的情况

解决方法

那么为了梯度下降算法特征下降的更快，更快收敛，我们就需要对各个数据进行数据标准化，例如：

第一个特征 X0量化纲位为： 0 ~ 2000
其平均值记为 u0:1000 ,
第二个特征 X1量化纲位为： 1 ~ 5
其平均值记为 u1:2

此时我们对其数据标准化使其为平均值为0的情况，操作如下：

X0 = (X0 - u0)/ X0量化纲位
X1 = (X1 - u1)/ X1量化纲位

这样x0,x1的量化纲位都在-1 ~ 1了，
就实现了数据标准化

特别注释：

我们在进行数据标准化不需要太精确的结果，对于结果不一定都要 0 ~ 1，0 ~ 2也可以接受，因为我们目的已经达到了，让“山”没那么陡峭，方便下山
如果对应数据量化纲位有 0 ~ 3，-3~ 3 ，这种其实还可以接受，不需要数据标准化

【声明】本内容来自华为云开发者社区博主，不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源（华为云社区）、文章链接、文章作者等基本信息，否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@huaweicloud.com

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

【机器学习】梯度下降之数据标准化

一、问题分析

二、3D可视化

解决方法

特别注释：

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

【机器学习】梯度下降之数据标准化

一、问题分析

二、3D可视化

解决方法

特别注释：

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品