近邻算法分类
【摘要】 scikit-learn已经封装好很多数据挖掘的算法
现介绍数据挖掘框架的搭建方法
转换器(Transformer)用于数据预处理,数据转换
流水线(Pipeline)组合数据挖掘流程,方便再次使用(封装)
估计器(Estimator)用于分类,聚类,回归分析(各种算法对象) 所有的估计器都有下面2个函数 fit() 训练 用法:estimator.f...
scikit-learn已经封装好很多数据挖掘的算法
现介绍数据挖掘框架的搭建方法
- 转换器(Transformer)用于数据预处理,数据转换
- 流水线(Pipeline)组合数据挖掘流程,方便再次使用(封装)
- 估计器(Estimator)用于分类,聚类,回归分析(各种算法对象)
- 所有的估计器都有下面2个函数
- fit() 训练
- 用法:estimator.fit(X_train, y_train),
- estimator = KNeighborsClassifier() 是scikit-learn算法对象
- X_train = dataset.data 是numpy数组
- y_train = dataset.target 是numpy数组
- predict() 预测
- 用法:estimator.predict(X_test)
- estimator = KNeighborsClassifier() 是scikit-learn算法对象
- X_test = dataset.data 是numpy数组
- fit() 训练
- 所有的估计器都有下面2个函数
电离层数据集
电离层数据集(Ionosphere Dataset)需要根据给定的电离层中的自由电子的雷达回波预测大气结构。
它是一个二元分类问题。每个类的观察值数量不均等,一共有 351 个观察值,34 个输入变量和1个输出变量。变量名如下:
1 17对雷达回波数据。
2 … …
3 类
文章来源: maoli.blog.csdn.net,作者:刘润森!,版权归原作者所有,如需转载,请联系作者。
原文链接:maoli.blog.csdn.net/article/details/90760629
【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)