高斯混合模型(GMM,GOM)

news/2024/11/14 13:22:36/

1.k-means聚类的缺点

        k-means聚类使用欧式距离为距离函数时,其二维本质是,以每个簇质心为圆心圈出来的一个一个圆圈。用这个圆将原始数据进行截断分类,但是实际数据分布不一定全是标准的圆形,还可能是椭圆等。这使得它对许多数据的分类拟合效果不尽如人意:

        1)类的形状不够灵活,拟合结果与实际相差较大,精度有限。

        2)样本对于是否属于每一个簇是确定的,即只有是与否,应用中缺少鲁棒性。

2.高斯混合模型

        基本思想:用多个高斯分布函数(正态分布)去近似任意形状的概率分布。将待聚类的数据点看成是分布的采样点,通过采样点利用类似极大似然估计的方法估计高斯分布的参数,求出参数(用EM算法求解)即得出了数据点对分类的隶属函数。

         GMM 的概率密度函数:

P\left ( x|\theta \right )=\sum_{k=1}^{K}P\left ( \theta_{k} \right )P\left ( x|\theta_{k} \right )

        其中;

        1)K 为模型的个数,即聚类的个数。

        2) P\left ( \theta_{k} \right ) 为数据样本属于第 k 个高斯分布的概率(先验分布,试验之前由相关知识得到的分布),其满足:

\sum_{k=1}^{K}P\left ( \theta_{k} \right )=1

        3)P\left ( x|\theta_{k} \right )为第 k 个高斯的概率密度,其中:

        \theta_{k}=\left ( u_{k},\sigma _{k}^{2} \right )

                u_{k} 为均值,\sigma _{k}^{2} 为方差。

        算法步骤:

        1)设置 k 的个数,即初始化高斯混合模型的成分个数。初始化每个簇的高斯分布参数。

        2)计算每个点属于每个高斯模型的概率。

        3)根据每个点和其属于每个高斯模型的概率,重新计算每个高斯模型的参数 \alpha _{k},\theta_{k}

        4)重复迭代计算步骤2)3)直到收敛。

        补充:

        1)前提假设数据样本服从高斯分布

        2)k-means是GMM的特例,即当GMM在所有维度的方差都一样的时候会呈现出圆形。

        3)GMM每次迭代的计算量要比k-means大很多,故可以先用k-means(重复多次取最优)得到初始聚类中心点,作为GMM的初始值进行迭代。

        

    


http://www.ppmy.cn/news/282870.html

相关文章

电子技术——共源共栅放大器

电子技术——共源共栅放大器 之前我们提到过,提高基础增益单元(共源放大器)的一种方法是提高其 r o r_o ro​ 的阻值,之后我们学过共栅放大器作为电流缓冲器可以做到这一点,自然地我们就得到了终极解决方案&#xff0…

如何理解GMM模型及应用

什么是GMM? GMM全称Gaussian Mixture Model,是一种机器学习算法,是一种聚类模型,它是多个高斯分布函数的线性组合。 GMM解决什么问题? 通常用来解决同一集合下的数据包含多种不同分布的情况。 GMM概率分布模型的形式? GMM的…

GMM基础

GMM 定义 高斯混合模型就是用高斯概率密度函数(正态分布曲线)精确地量化事物,它是一个将事物分解为若干的基于高斯概率密度函数(正态分布曲线)形成的模型。 几何表示 假如我们我们现有的数据分布如红线所示,可以发现用一个高斯分布很难较好的描述这组…

高斯混合模型 GMM 的详细解释

高斯混合模型(后面本文中将使用他的缩写 GMM)听起来很复杂,其实他的工作原理和 KMeans 非常相似,你甚至可以认为它是 KMeans 的概率版本。 这种概率特征使 GMM 可以应用于 KMeans 无法解决的许多复杂问题。 因为KMeans的限制很多…

GMSL介绍

随着汽车智能化的不断提升,特别是高级辅助驾驶系统(ADAS)的普及,越来越多的车载摄像头和传感器需要与汽车电子控制单元(ECU)进行数据通信,对车内数据传输的带宽、实时性和稳定性的要求也越来越高…

GMM模型

(一)高斯判别分析模型(Gaussian discriminant analysis,GDA) 1.GDA模型是服从高斯分布的生成模型: (1)假设每个类别的样本数据服从多元高斯分布: (2&#x…

GLM(Generalized Linear Models)模型详解

Generalized Linear Models广义线性模型 指数家族(The exponential family) 指数家族是指一类概率分布,其具有指数模式。需要注意,这是一类概率分布,不是特指某个概率分布,因此指数分布只有固定的格式&am…

GMM

GMM 模型 GMM由K个Gaussian分布线性叠加而成,先看看GMM的概率密度函数: p(x)∑k1Kp(k)p(x|k)∑k1KπkN(x|μk,Σk) 该函数可以这么理解,假设我们有一个数据集,然后我们现在用GMM模型来描述这个数据集的分布。在已知数据集由comp…