class sklearn.cluster.KMeans(n_clusters=8, init='k-means++', n_init=10, max_iter=300, tol=0.0001, precompute_distances='auto', verbose=0, random_state=None, copy_x=True, n_jobs=1, algorithm='auto')
     
    
   
    
     
    
    
       """
     
    
   
    
     
    
    
     
       :param n_clusters:要形成的聚类数以及生成的质心数
     
    
   
    
     
    
    
     
      
     
    
   
    
     
    
    
     
       :param init:初始化方法，默认为'k-means ++',以智能方式选择k-均值聚类的初始聚类中心，以加速收敛;random,从初始质心数据中随机选择k个观察值（行
     
    
   
    
     
    
    
     
      
     
    
   
    
     
    
    
     
       :param n_init：int，默认值：10使用不同质心种子运行k-means算法的时间。最终结果将是n_init连续运行在惯性方面的最佳输出。
     
    
   
    
     
    
    
     
      
     
    
   
    
     
    
    
     
       :param n_jobs：int用于计算的作业数量。这可以通过并行计算每个运行的n_init。如果-1使用所有CPU。如果给出1，则不使用任何并行计算代码，这对调试很有用。对于-1以下的n_jobs，使用（n_cpus + 1 + n_jobs）。因此，对于n_jobs = -2，所有CPU都使用一个。
     
    
   
    
     
    
    
     
      
     
    
   
    
     
    
    
     
       :param random_state:随机数种子，默认为全局numpy随机数生成器
     
    
   
    
     
    
    
     
       """


  
   
    
     
    
    
     
      from sklearn.cluster import KMeans
     
    
   
    
     
    
    
     
      import numpy as np
     
    
   
    
     
    
    
     
      X = np.array([[1, 2], [1, 4], [1, 0],[4, 2], [4, 4], [4, 0]])
     
    
   
    
     
    
    
     
      kmeans = KMeans(n_clusters=2, random_state=0)

方法

fit(X,y=None)

使用X作为训练数据拟合模型

kmeans.fit(X)

predict(X)

预测新的数据所在的类别


  
   
    
     
    
    
     
      kmeans.predict([[0, 0], [4, 4]])
     
    
   
    
     
    
    
     
      array([0, 1], dtype=int32)

属性

clustercenters

集群中心的点坐标


  
   
    
     
    
    
     
      kmeans.cluster_centers_
     
    
   
    
     
    
    
     
      array([[ 1., 2.],
     
    
   
    
     
    
    
     
       [ 4., 2.]])

labels_

每个点的类别

kmeans.labels_

k-means ++

k-means案例分析

手写数字数据上K-Means聚类的演示


  
   
    
     
    
    
     
      from sklearn.metrics import silhouette_score
     
    
   
    
     
    
    
     
      from sklearn.cluster import KMeans
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      def kmeans():
     
    
   
    
     
    
    
      """
     
    
   
    
     
    
    
     
       手写数字聚类过程
     
    
   
    
     
    
    
     
       :return: None
     
    
   
    
     
    
    
     
       """
     
    
   
    
     
    
    
      # 加载数据
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
       ld = load_digits()
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
       print(ld.target[:20])
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
      # 聚类
     
    
   
    
     
    
    
     
       km = KMeans(n_clusters=810)
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
       km.fit_transform(ld.data)
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
       print(km.labels_[:20])
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
       print(silhouette_score(ld.data,km.labels_))
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
      return None
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      if __name__=="__main__":
     
    
   
    
     
    
    
     
       kmeans()

文章来源: drugai.blog.csdn.net，作者：DrugAI，版权归原作者所有，如需转载，请联系作者。

原文链接：drugai.blog.csdn.net/article/details/104333377

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

Machine Learning | (12) 非监督学习-k-means

非监督学习之k-means

sklearn.cluster.KMeans

方法

属性

k-means ++

k-means案例分析

手写数字数据上K-Means聚类的演示

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

Machine Learning | (12) 非监督学习-k-means

非监督学习之k-means

sklearn.cluster.KMeans

方法

属性

k-means ++

k-means案例分析

手写数字数据上K-Means聚类的演示

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品