机器学习进阶 第一节 第三课

举报
我是小白呀iamarookie 发表于 2021/09/10 00:58:01 2021/09/10
【摘要】 特征预处理 概述数值型数据标准缩放归一化sklearn 归一化 APIMinMaxScaler 语法归一化步骤归一化案例 概述 特征处理: 通过特定的统计方法 (数学方法)将数据...

概述

特征处理: 通过特定的统计方法 (数学方法)将数据转换成算法要求的数据.

sklearn 特征处理 API: sklearn.preprocessing

数值型数据标准缩放

归一化

归一化: 通过对原始数据进行变换把数据映射到 (默认为 [0,1] ) 之间.
在这里插入图片描述
注: 作用于每一列, max 为一列的最大值, min 为一列的最小值. 那么 X’’ 为最终结果. mx, mi 分别为指定区间值默认 mx 为 1, mi 为 0.
在这里插入图片描述

sklearn 归一化 API

sklearn 归一化 API: sklearn.preprocessing.MinMaxScaler

MinMaxScaler 语法

MinMaxScalar(feature_range=(0,1)...) 每个特征缩放到给定范围(默认[0,1])

  
 
  • 1

MinMaxScalar.fit_transform(X)

  • X: numpy array 格式的数据 [n_samples, n_features]
  • 返回值: 转换后的形状相同的 array

归一化步骤

  1. 实例化 MinMaxScalar
  2. 通过 fit_transform 转换
from sklearn.preprocessing import MinMaxScaler


def mm():
    """
    归一化处理
    :return: None
    """

    # 实例化
    mm = MinMaxScaler()

    txt = [[90, 2, 10, 40], [60, 4, 15, 45], [75, 3, 13, 46]]
    data = mm.fit_transform(txt)

    print(data)


if __name__ == "__main__":
    mm()

输出结果:
[[1.         0.         0.         0.        ]
 [0.         1.         1.         0.83333333]
 [0.5        0.5        0.6        1.        ]]

  
 
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25

归一化案例

相亲约会对象数据, 这个样本时男士的数据, 三个特征:

  1. 玩游戏所消耗时间的百分比
  2. 每年获得的飞行常客里程数
  3. 每周消费的冰淇淋公升数

然后有一个所属类别, 被女士评价的三个类别:

  1. 不喜欢 didn’t
  2. 魅力一般 small
  3. 极具魅力 large

也许就是说飞行里程数对于结算结果或者是相亲结果影响较大, 但是统计的人觉得这三个特征同等重要.
在这里插入图片描述

文章来源: iamarookie.blog.csdn.net,作者:我是小白呀,版权归原作者所有,如需转载,请联系作者。

原文链接:iamarookie.blog.csdn.net/article/details/110733747

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。