数学建模暑期集训20:层次聚类法matlab+python

举报
zstar 发表于 2022/08/06 00:58:05 2022/08/06
【摘要】 本专栏第二篇文章介绍过层次聚类法 数学建模学习笔记(二)层次聚类法 matlab代码如下: clc; clear; Y=[0.080 0.143 2.000 0.250 0.500 0.286 0.14...

本专栏第二篇文章介绍过层次聚类
数学建模学习笔记(二)层次聚类法
matlab代码如下:

clc;
clear;
Y=[0.080 0.143 2.000 0.250 0.500 0.286 0.143 2.000 2.000 inf];
Z=linkage(Y,'average')
dendrogram(Z)

  
 
  • 1
  • 2
  • 3
  • 4
  • 5

然而,当数据量大于30个时,该方法仅能显示前30个的数据,后面的数据无法绘制出图像。
为了应对数据量大时的情况,可以用python进行层次聚类。

python代码:

import pandas as pd
import seaborn as sns  # 用于绘制热图的工具包
from scipy.cluster import hierarchy  # 用于进行层次聚类,话层次聚类图的工具包
from scipy import cluster
import matplotlib.pyplot as plt
from sklearn import decomposition as skldec  # 用于主成分分析降维的包
from scipy.cluster.hierarchy import dendrogram, linkage, fcluster
from matplotlib import pyplot as plt
df = pd.read_excel("tempdata.xlsx", index_col=0, header=None)  #index_col=0指定数据中第一列是类别名称,PS:计算机程序一般从整数0开始计数,所以0就代表第一列
# df = df.T    #python默认每行是一个样本,如果数据每列是一个样本的话,转置一下即可
X = df.index
# print (X)
# method是指计算类间距离的方法,比较常用的有3种:
# single:最近邻,把类与类间距离最近的作为类间距
# average:平均距离,类与类间所有pairs距离的平均
# complete:最远邻,把类与类间距离最远的作为类间距
Z = linkage(X, 'average')
f = fcluster(Z, 4, 'distance')
fig = plt.figure()
dn = dendrogram(Z)
plt.show()

  
 
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21

在这里插入图片描述

文章来源: zstar.blog.csdn.net,作者:zstar-_,版权归原作者所有,如需转载,请联系作者。

原文链接:zstar.blog.csdn.net/article/details/119804880

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。