机器学习进阶 第一节 第三课
【摘要】
特征预处理
概述数值型数据标准缩放归一化sklearn 归一化 APIMinMaxScaler 语法归一化步骤归一化案例
概述
特征处理: 通过特定的统计方法 (数学方法)将数据...
概述
特征处理: 通过特定的统计方法 (数学方法)将数据转换成算法要求的数据.
sklearn 特征处理 API: sklearn.preprocessing
数值型数据标准缩放
归一化
归一化: 通过对原始数据进行变换把数据映射到 (默认为 [0,1] ) 之间.

注: 作用于每一列, max 为一列的最大值, min 为一列的最小值. 那么 X’’ 为最终结果. mx, mi 分别为指定区间值默认 mx 为 1, mi 为 0.

sklearn 归一化 API
sklearn 归一化 API: sklearn.preprocessing.MinMaxScaler
MinMaxScaler 语法
MinMaxScalar(feature_range=(0,1)...) 每个特征缩放到给定范围(默认[0,1])
- 1
MinMaxScalar.fit_transform(X)
- X: numpy array 格式的数据 [n_samples, n_features]
- 返回值: 转换后的形状相同的 array
归一化步骤
- 实例化 MinMaxScalar
- 通过 fit_transform 转换
from sklearn.preprocessing import MinMaxScaler
def mm():
"""
归一化处理
:return: None
"""
# 实例化
mm = MinMaxScaler()
txt = [[90, 2, 10, 40], [60, 4, 15, 45], [75, 3, 13, 46]]
data = mm.fit_transform(txt)
print(data)
if __name__ == "__main__":
mm()
输出结果:
[[1. 0. 0. 0. ]
[0. 1. 1. 0.83333333]
[0.5 0.5 0.6 1. ]]
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
归一化案例
相亲约会对象数据, 这个样本时男士的数据, 三个特征:
- 玩游戏所消耗时间的百分比
- 每年获得的飞行常客里程数
- 每周消费的冰淇淋公升数
然后有一个所属类别, 被女士评价的三个类别:
- 不喜欢 didn’t
- 魅力一般 small
- 极具魅力 large
也许就是说飞行里程数对于结算结果或者是相亲结果影响较大, 但是统计的人觉得这三个特征同等重要.

文章来源: iamarookie.blog.csdn.net,作者:我是小白呀,版权归原作者所有,如需转载,请联系作者。
原文链接:iamarookie.blog.csdn.net/article/details/110733747
【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)