机器学习:数据特征预处理缺失值处理
【摘要】 缺失值处理
删除:如果行或列数据缺失值达到一定比例,建议放弃整行或列 插补:填补列的平均值,中位数
numpy数组中的缺失值 nan/NaN 属于float类型
代码示例
from sklearn.preprocessing import Imputer
import numpy as np
# 缺失值处理
data = [ [1, 1, 3], [np.na...
缺失值处理
删除:如果行或列数据缺失值达到一定比例,建议放弃整行或列
插补:填补列的平均值,中位数
numpy数组中的缺失值 nan/NaN 属于float类型
代码示例
from sklearn.preprocessing import Imputer
import numpy as np
# 缺失值处理
data = [ [1, 1, 3], [np.nan, 4, 6], [7, 3, 5]
]
im = Imputer(missing_values="NaN", strategy="mean", axis=0)
result = im.fit_transform(data)
print(result)
"""
[[1. 1. 3.]
[4. 4. 6.]
[7. 3. 5.]]
"""
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
文章来源: pengshiyu.blog.csdn.net,作者:彭世瑜,版权归原作者所有,如需转载,请联系作者。
原文链接:pengshiyu.blog.csdn.net/article/details/86430553
【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)