混合高斯模型(GMM)

举报
可爱又积极 发表于 2021/09/16 11:17:46 2021/09/16
【摘要】 1 GMM基础高斯混合模型(GMM)指的是多个高斯分布函数的线性组合,理论上GMM可以拟合出任意类型的分布,通常用于解决同一集合下的数据包含多个不同的分布的情况。为什么GMM可以拟合出任意类型的分布?不仅GMM可以,只要性质不太奇怪的混合模型一般都能近似任意分布。这个思想和泰勒展开、傅里叶变换是类似的,任何波形都可以用正弦波叠加表示,而且频率还是基频的整数倍。利用高斯混合模型进行聚类,本质上...

1 GMM基础
高斯混合模型(GMM)指的是多个高斯分布函数的线性组合,理论上GMM可以拟合出任意类型的分布,通常用于解决同一集合下的数据包含多个不同的分布的情况。
为什么GMM可以拟合出任意类型的分布?
不仅GMM可以,只要性质不太奇怪的混合模型一般都能近似任意分布。这个思想和泰勒展开、傅里叶变换是类似的,任何波形都可以用正弦波叠加表示,而且频率还是基频的整数倍。
利用高斯混合模型进行聚类,本质上可以这么理解:
数据的分布由若干高斯分布组合而成,需要通过传入的无标记数据,求解出各个高斯模型的参数和各个模型的先验概率!不同于一般利用最大似然估计参数的情况在于由于传入的数据无标记,也就是说缺少了观测数据的类别这个隐藏信息,所以这个隐藏信息的概率分布也成了估计内容之一,从而无法通过求偏导进行梯度下降来求解,于是利用了EM。
设有随机变量X,则混合高斯模型可以用下式表示:
image.png
image.png

其中N(x∣μk,Σk)称为混合模型中的第k个分量。
image.png

其中,µ为高斯分布的均值向量,ε为高斯分布的协方差矩阵。
若有三个聚类,可以用三个二维高斯分布来表示,那么分量数K=3。 πk是混合系数,且满足:
image.png

可以认为πk就是每个分量N(x∣μk,Σk)的权重。
image.png

2 GMM的隐变量
隐变量是一个辅助变量,GMM的隐变量表示的是样本x属于哪一个高斯分布。
隐变量是一个向量,并且这个向量中只有一个元素取值为1,其它的都是0。因为假设只有一个高斯分量被选中并产生观测数据。然而我们的GMM的一个观测数据在直观上应该是每个高斯分量都有产生,而不是由一个高斯分量单独生成,只是重要性不同(由系数控制)
假设我们知道数据可以分为两类,在随机抽取一个数据点,不知道这个数据来自第一类还是第二类,类比GMM中K1、K2的高斯分模型,不知道数据来自哪个分模型。
隐变量就是为了描述数据归属看不见这个现象的。
隐变量是一个离散的随机变量。
GMM中K1、K2、K3类比箱子1、箱子2、箱子3,类比HMM中状态1、状态2、状态3。
image.png

3 GMM训练问题
极大似然估计、EM

  1. 极大似然估计
    利用不完全数据(只有观测数据)的边缘分布。
    给定一些观测数据X={x},假设{x}符合混合高斯分布:
    image.png
    image.png

求解一组混合高斯模型的参数使得:
image.png

对目标函数取对数:
image.png
对数似然函数分别对参数Π,µ,ε求导,使得导数等于0,来更新参数。
目标函数是和的对数,这时候求导比较困难,形式复杂,同时,还有个问题就是求一个参数的时候会依赖其他参数的值,但是其他参数的值其实也是未知的,也是待估计的。因此需要EM算法。
4 EM算法深入理解
beb5c42c346308d7148deebb90204be.jpg

2173f50b78b7e0b2eae3382eb141dfb.jpg

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。