近邻算法分类

举报
毛利 发表于 2021/07/15 08:34:38 2021/07/15
【摘要】 scikit-learn已经封装好很多数据挖掘的算法 现介绍数据挖掘框架的搭建方法 转换器(Transformer)用于数据预处理,数据转换 流水线(Pipeline)组合数据挖掘流程,方便再次使用(封装) 估计器(Estimator)用于分类,聚类,回归分析(各种算法对象) 所有的估计器都有下面2个函数 fit() 训练 用法:estimator.f...

scikit-learn已经封装好很多数据挖掘的算法

现介绍数据挖掘框架的搭建方法

  • 转换器(Transformer)用于数据预处理,数据转换
  • 流水线(Pipeline)组合数据挖掘流程,方便再次使用(封装)
  • 估计器(Estimator)用于分类,聚类,回归分析(各种算法对象)
    • 所有的估计器都有下面2个函数
      • fit() 训练
        • 用法:estimator.fit(X_train, y_train),
        • estimator = KNeighborsClassifier() 是scikit-learn算法对象
        • X_train = dataset.data 是numpy数组
        • y_train = dataset.target 是numpy数组
      • predict() 预测
        • 用法:estimator.predict(X_test)
        • estimator = KNeighborsClassifier() 是scikit-learn算法对象
        • X_test = dataset.data 是numpy数组

电离层数据集
电离层数据集(Ionosphere Dataset)需要根据给定的电离层中的自由电子的雷达回波预测大气结构。

它是一个二元分类问题。每个类的观察值数量不均等,一共有 351 个观察值,34 个输入变量和1个输出变量。变量名如下:

1 17对雷达回波数据。
2 … …
3 类

文章来源: maoli.blog.csdn.net,作者:刘润森!,版权归原作者所有,如需转载,请联系作者。

原文链接:maoli.blog.csdn.net/article/details/90760629

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。