机器学习(五):数据缩放

举报
川川菜鸟 发表于 2022/08/04 23:12:13 2022/08/04
【摘要】 文章目录 一、为什么要数据缩放? 二、数据集与手动标准化 三、案例实现 一、为什么要数据缩放? 当你的数据拥有不同的值,甚至...

一、为什么要数据缩放?

当你的数据拥有不同的值,甚至使用不同的度量单位时,可能很难比较它们。与米相比,公斤是多少?或者海拔比较时间呢?

一般不同的特征变化不一样,都需要进行数据缩放,也可以说成数据标准化。

二、数据集与手动标准化

它与我们在多元回归一章中使用的数据集相同,但是这次,Volume 列包含的单位是升,而不是 ccm(1.0 而不是 1000)。
在这里插入图片描述
很难将排量 1.0 与车重 790 进行比较,但是如果将它们都缩放为可比较的值,我们可以很容易地看到一个值与另一个值相比有多少。

缩放数据有多种方法,在本教程中,我们将使用一种称为标准化(standardization)的方法。标准化方法使用以下公式:

z = (x -
  
 

    文章来源: chuanchuan.blog.csdn.net,作者:川川菜鸟,版权归原作者所有,如需转载,请联系作者。

    原文链接:chuanchuan.blog.csdn.net/article/details/126059363

    【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
    • 点赞
    • 收藏
    • 关注作者

    评论(0

    0/1000
    抱歉,系统识别当前为高风险访问,暂不支持该操作

    全部回复

    上滑加载中

    设置昵称

    在此一键设置昵称,即可参与社区互动!

    *长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

    *长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。