数学建模暑期集训20:层次聚类法matlab+python
【摘要】
本专栏第二篇文章介绍过层次聚类法 数学建模学习笔记(二)层次聚类法 matlab代码如下:
clc;
clear;
Y=[0.080 0.143 2.000 0.250 0.500 0.286 0.14...
本专栏第二篇文章介绍过层次聚类法
数学建模学习笔记(二)层次聚类法
matlab代码如下:
clc;
clear;
Y=[0.080 0.143 2.000 0.250 0.500 0.286 0.143 2.000 2.000 inf];
Z=linkage(Y,'average')
dendrogram(Z)
- 1
- 2
- 3
- 4
- 5
然而,当数据量大于30个时,该方法仅能显示前30个的数据,后面的数据无法绘制出图像。
为了应对数据量大时的情况,可以用python进行层次聚类。
python代码:
import pandas as pd
import seaborn as sns # 用于绘制热图的工具包
from scipy.cluster import hierarchy # 用于进行层次聚类,话层次聚类图的工具包
from scipy import cluster
import matplotlib.pyplot as plt
from sklearn import decomposition as skldec # 用于主成分分析降维的包
from scipy.cluster.hierarchy import dendrogram, linkage, fcluster
from matplotlib import pyplot as plt
df = pd.read_excel("tempdata.xlsx", index_col=0, header=None) #index_col=0指定数据中第一列是类别名称,PS:计算机程序一般从整数0开始计数,所以0就代表第一列
# df = df.T #python默认每行是一个样本,如果数据每列是一个样本的话,转置一下即可
X = df.index
# print (X)
# method是指计算类间距离的方法,比较常用的有3种:
# single:最近邻,把类与类间距离最近的作为类间距
# average:平均距离,类与类间所有pairs距离的平均
# complete:最远邻,把类与类间距离最远的作为类间距
Z = linkage(X, 'average')
f = fcluster(Z, 4, 'distance')
fig = plt.figure()
dn = dendrogram(Z)
plt.show()
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
文章来源: zstar.blog.csdn.net,作者:zstar-_,版权归原作者所有,如需转载,请联系作者。
原文链接:zstar.blog.csdn.net/article/details/119804880
【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)