ism模型python算法_高斯混合模型（GMM）：理念、数学、EM算法和python实现

作者：皇家城市_579 | 来源：互联网 | 2023-06-09 12:52

高斯混合模型是一种流行的无监督学习算法。GMM方法类似于K-Means聚类算法，但是由于其复杂性，它更健壮，因此更有用。K-means聚类

高斯混合模型是一种流行的无监督学习算法。GMM方法类似于K-Means聚类算法&＃xff0c;但是由于其复杂性&＃xff0c;它更健壮&＃xff0c;因此更有用。

K-means聚类使用欧式距离函数来发现数据中的聚类。只要数据相对于质心呈圆形分布&＃xff0c;此方法就可以很好地工作。但是&＃xff0c;如果数据是非线性的呢&＃xff1f;或者数据具有非零的协方差呢&＃xff1f;如果聚类具有不同的均值和协方差怎么办&＃xff1f;

这就要用到高斯混合模型了!

GMM假设生成数据的是一种混合的高斯分布。与将数据点硬分配到聚类的K-means方法(假设围绕质心的数据呈圆形分布)相比&＃xff0c;它使用了将数据点软分配到聚类的方法(即概率性&＃xff0c;因此更好)。

简而言之&＃xff0c;GMM效果更好&＃xff0c;因为&＃xff1a;(A)通过使用软分配捕获属于不同聚类的数据点的不确定性&＃xff0c;(B)对圆形聚类没有偏见。即使是非线性数据分布&＃xff0c;它也能很好地工作。

GMM
GMM的目标函数是最大化数据X、p(X)或对数似然值L的似然值(因为对数是单调递增函数)。通过假设混合了K个高斯来生成数据&＃xff0c;我们可以将p(X)写为边缘概率&＃xff0c;对所有数据点的K个聚类求和。
似然值
对数似然值
利用上面对数函数的求和&＃xff0c;我们不能得到解析解。看起来很讨厌&＃xff0c;但这个问题有一个很好的解决方案&＃xff1a;Expectation-Maximization(EM)算法。

数学
EM算法是一种迭代算法&＃xff0c;用于在无法直接找到参数的情况下寻找模型的最大似然估计(MLE)。它包括两个步骤:期望步骤和最大化步骤。
1.期望步骤:计算成员值r_ic。这是数据点x_i属于聚类c的概率。
2. 最大化步骤&＃xff1a;计算一个新参数mc&＃xff0c;该参数确定属于不同聚类的点的分数。通过计算每个聚类c的MLE来更新参数μ&＃xff0c;π&＃xff0c;Σ。
重复EM步骤&＃xff0c;直到对数似然值L收敛。

Python编码
让我们从头开始用python编写GMM的基本实现。
生成一维数据。
`x &＃61; np.linspace(-5, 5, 20)x1 &＃61; xnp.random.rand(20)x2 &＃61; xnp.random.rand(20) &＃43; 10x3 &＃61; xnp.random.rand(20) - 10xt &＃61; np.hstack((x1,x2,x3))`
初始化GMM的参数&＃xff1a;μ&＃xff0c;π&＃xff0c;Σ。
`max_iterations &＃61; 10pi &＃61; np.array([1/3, 1/3, 1/3])mu &＃61; np.array([5,6,-3])var &＃61; np.array([1,3,9])r &＃61; np.zeros((len(xt), 3))`
运行EM算法的第一次迭代
import matplotlib.pyplot as pltimport numpy as npfrom scipy.stats import normgauss1 &＃61; norm(loc&＃61;mu[0], scale&＃61;var[0])gauss2 &＃61; norm(loc&＃61;mu[1], scale&＃61;var[1])gauss3 &＃61; norm(loc&＃61;mu[2], scale&＃61;var[2]) # E-Stepfor c,g,p in zip(range(3), [gauss1, gauss2, gauss3], pi): r[:,c] &＃61; pg.pdf(xt[:])for i in range(len(r)): r[i,:] /&＃61; np.sum(r[i,:])fig &＃61; plt.figure(figsize&＃61;(10,10))ax0 &＃61; fig.add_subplot(111)for i in range(len(r)): ax0.scatter(xt[i],0,c&＃61;r[i,:],s&＃61;100) for g,c in zip([gauss1.pdf(np.linspace(-15,15)),gauss2.pdf(np.linspace(-15,15)),gauss3.pdf(np.linspace(-15,15))],[&＃39;r&＃39;,&＃39;g&＃39;,&＃39;b&＃39;]): ax0.plot(np.linspace(-15,15),g,c&＃61;c,zorder&＃61;0)ax0.set_xlabel(&＃39;X-axis&＃39;)ax0.set_ylabel(&＃39;Gaussian pdf value&＃39;)ax0.legend([&＃39;Gaussian 1&＃39;, &＃39;Gaussian 2&＃39;, &＃39;Gaussian 3&＃39;])plt.show() # M-Stepmc &＃61; np.sum(r, axis&＃61;0)pi &＃61; mc/len(xt)mu &＃61; np.sum(rnp.vstack((xt, xt, xt)).T, axis&＃61;0)/mcvar &＃61; []for c in range(len(pi)): var.append(np.sum(np.dot(r[:,c](xt[i] - mu[c]).T, r[:,c](xt[i] - mu[c])))/mc[c])
将此代码放在for循环中&＃xff0c;并将其放在类对象中。
class GMM1D: """Apply GMM to 1D Data""" def init(self, X, max_iterations): """Initialize data and max_iterations""" self.X &＃61; X self.max_iterations &＃61; max_iterations def run(self): """Initialize parameters mu, var, pi""" self.pi &＃61; np.array([1/3, 1/3, 1/3]) self.mu &＃61; np.array([5,8,1]) self.var &＃61; np.array([5,3,1]) r &＃61; np.zeros((len(self.X), 3)) for itr in range(self.max_iterations): gauss1 &＃61; norm(loc&＃61;self.mu[0], scale&＃61;self.var[0]) gauss2 &＃61; norm(loc&＃61;self.mu[1], scale&＃61;self.var[1]) gauss3 &＃61; norm(loc&＃61;self.mu[2], scale&＃61;self.var[2]) # E-Step for c,g,p in zip(range(3), [gauss1, gauss2, gauss3], self.pi): r[:,c] &＃61; pg.pdf(xt[:]) for i in range(len(r)): r[i,:] /&＃61; np.sum(r[i,:]) fig &＃61; plt.figure(figsize&＃61;(10,10)) ax0 &＃61; fig.add_subplot(111) for i in range(len(r)): ax0.scatter(xt[i],0,c&＃61;r[i,:],s&＃61;100) for g,c in zip([gauss1.pdf(np.linspace(-15,15)),gauss2.pdf(np.linspace(-15,15)),gauss3.pdf(np.linspace(-15,15))],[&＃39;r&＃39;,&＃39;g&＃39;,&＃39;b&＃39;]): ax0.plot(np.linspace(-15,15),g,c&＃61;c,zorder&＃61;0) plt.show() # M-Step mc &＃61; np.sum(r, axis&＃61;0) self.pi &＃61; mc/len(self.X) self.mu &＃61; np.sum(rnp.vstack((self.X, self.X, self.X)).T, axis&＃61;0)/mc self.var &＃61; [] for c in range(len(self.pi)): self.var.append(np.sum(np.dot(r[:,c](self.X[i] - self.mu[c]).T, r[:,c](self.X[i] - self.mu[c])))/mc[c])gmm &＃61; GMM1D(xt, 10)gmm.run()
我们已经建立并运行了一个一维数据模型。同样的原理也适用于更高维度(≥2D)。唯一的区别是我们将使用多元高斯分布。让我们为2D模型编写Python代码。
让我们生成一些数据并编写我们的模型
`from sklearn.datasets.samples_generator import make_blobsfrom scipy.stats import multivariate_normalX,Y &＃61; make_blobs(cluster_std&＃61;1.5,random_state&＃61;20,n_samples&＃61;500,centers&＃61;3)X &＃61; np.dot(X, np.random.RandomState(0).randn(2,2))plt.figure(figsize&＃61;(8,8))plt.scatter(X[:, 0], X[:, 1])plt.show()`
class GMM2D: """Apply GMM to 2D data""" def init(self, num_clusters, max_iterations): """Initialize num_clusters(K) and max_iterations for the model""" self.num_clusters &＃61; num_clusters self.max_iterations &＃61; max_iterations def run(self, X): """Initialize parameters and run E and M step storing log-likelihood value after every iteration""" self.pi &＃61; np.ones(self.num_clusters)/self.num_clusters self.mu &＃61; np.random.randint(min(X[:, 0]), max(X[:, 0]), size&＃61;(self.num_clusters, len(X[0]))) self.cov &＃61; np.zeros((self.num_clusters, len(X[0]), len(X[0]))) for n in range(len(self.cov)): np.fill_diagonal(self.cov[n], 5) # reg_cov is used for numerical stability i.e. to check singularity issues in covariance matrix self.reg_cov &＃61; 1e-6np.identity(len(X[0])) x,y &＃61; np.meshgrid(np.sort(X[:,0]), np.sort(X[:,1])) self.XY &＃61; np.array([x.flatten(), y.flatten()]).T # Plot the data and the initial model fig0 &＃61; plt.figure(figsize&＃61;(10,10)) ax0 &＃61; fig0.add_subplot(111) ax0.scatter(X[:, 0], X[:, 1]) ax0.set_title("Initial State") for m, c in zip(self.mu, self.cov): c &＃43;&＃61; self.reg_cov multi_normal &＃61; multivariate_normal(mean&＃61;m, cov&＃61;c) ax0.contour(np.sort(X[:, 0]), np.sort(X[:, 1]), multi_normal.pdf(self.XY).reshape(len(X), len(X)), colors &＃61; &＃39;black&＃39;, alpha &＃61; 0.3) ax0.scatter(m[0], m[1], c&＃61;&＃39;grey&＃39;, zorder&＃61;10, s&＃61;100) fig0.savefig(&＃39;GMM2D Initial State.png&＃39;) plt.show() self.log_likelihoods &＃61; [] for iters in range(self.max_iterations): # E-Step self.ric &＃61; np.zeros((len(X), len(self.mu))) for pic, muc, covc, r in zip(self.pi, self.mu, self.cov, range(len(self.ric[0]))): covc &＃43;&＃61; self.reg_cov mn &＃61; multivariate_normal(mean&＃61;muc, cov&＃61;covc) self.ric[:, r] &＃61; picmn.pdf(X) for r in range(len(self.ric)): self.ric[r, :] &＃61; self.ric[r, :] / np.sum(self.ric[r, :]) # M-step self.mc &＃61; np.sum(self.ric, axis&＃61;0) self.pi &＃61; self.mc/np.sum(self.mc) self.mu &＃61; np.dot(self.ric.T, X) / self.mc.reshape(self.num_clusters,1) self.cov &＃61; [] for r in range(len(self.pi)): covc &＃61; 1/self.mc[r] (np.dot( (self.ric[:, r].reshape(len(X), 1)(X-self.mu[r]) ).T, X - self.mu[r]) &＃43; self.reg_cov) self.cov.append(covc) self.cov &＃61; np.asarray(self.cov) self.log_likelihoods.append(np.log(np.sum([self.pi[r]multivariate_normal(self.mu[r], self.cov[r] &＃43; self.reg_cov).pdf(X) for r in range(len(self.pi))]))) fig1 &＃61; plt.figure(figsize&＃61;(10,10)) ax1 &＃61; fig1.add_subplot(111) ax1.scatter(X[:, 0], X[:, 1]) ax1.set_title("Iteration " &＃43; str(iters)) for m, c in zip(self.mu, self.cov): c &＃43;&＃61; self.reg_cov multi_normal &＃61; multivariate_normal(mean&＃61;m, cov&＃61;c) ax1.contour(np.sort(X[:, 0]), np.sort(X[:, 1]), multi_normal.pdf(self.XY).reshape(len(X), len(X)), colors &＃61; &＃39;black&＃39;, alpha &＃61; 0.3) ax1.scatter(m[0], m[1], c&＃61;&＃39;grey&＃39;, zorder&＃61;10, s&＃61;100) fig1.savefig("GMM2D Iter " &＃43; str(iters) &＃43; ".png") plt.show() fig2 &＃61; plt.figure(figsize&＃61;(10,10)) ax2 &＃61; fig2.add_subplot(111) ax2.plot(range(0, iters&＃43;1, 1), self.log_likelihoods) ax2.set_title(&＃39;Log Likelihood Values&＃39;) fig2.savefig(&＃39;GMM2D Log Likelihood.png&＃39;) plt.show() def predict(self, Y): """Predicting cluster for new samples in array Y""" predictions &＃61; [] for pic, m, c in zip(self.pi, self.mu, self.cov): prob &＃61; picmultivariate_normal(mean&＃61;m, cov&＃61;c).pdf(Y) predictions.append([prob]) predictions &＃61; np.asarray(predictions).reshape(len(Y), self.num_clusters) predictions &＃61; np.argmax(predictions, axis&＃61;1) fig2 &＃61; plt.figure(figsize&＃61;(10,10)) ax2 &＃61; fig2.add_subplot(111) ax2.scatter(X[:, 0], X[:, 1], c&＃61;&＃39;c&＃39;) ax2.scatter(Y[:, 0], Y[:, 1], marker&＃61;&＃39;&＃39;, c&＃61;&＃39;k&＃39;, s&＃61;150, label &＃61; &＃39;New Data&＃39;) ax2.set_title("Predictions on New Data") colors &＃61; [&＃39;r&＃39;, &＃39;b&＃39;, &＃39;g&＃39;] for m, c, col, i in zip(self.mu, self.cov, colors, range(len(colors))): # c &＃43;&＃61; reg_cov multi_normal &＃61; multivariate_normal(mean&＃61;m, cov&＃61;c) ax2.contour(np.sort(X[:, 0]), np.sort(X[:, 1]), multi_normal.pdf(self.XY).reshape(len(X), len(X)), colors &＃61; &＃39;black&＃39;, alpha &＃61; 0.3) ax2.scatter(m[0], m[1], marker&＃61;&＃39;o&＃39;, c&＃61;col, zorder&＃61;10, s&＃61;150, label &＃61; &＃39;Centroid &＃39; &＃43; str(i&＃43;1)) for i in range(len(Y)): ax2.scatter(Y[i, 0], Y[i, 1], marker&＃61;&＃39;*&＃39;, c&＃61;colors[predictions[i]], s&＃61;150) ax2.set_xlabel(&＃39;X-axis&＃39;) ax2.set_ylabel(&＃39;Y-axis&＃39;) ax2.legend() fig2.savefig(&＃39;GMM2D Predictions.png&＃39;) plt.show() return predictions
让我们对此模型进行一些预测
`y &＃61; np.random.randint(-10, 20, size&＃61;(12, 2))gmm2d &＃61; GMM2D(num_clusters&＃61;3, max_iterations&＃61;10)gmm2d.run(X)gmm2d.predict(y)`
如果使用sklearn&＃xff0c;可以在几行代码中完成相同的任务。
`from sklearn.mixture import GaussianMixtureX,Y &＃61; make_blobs(cluster_std&＃61;1.5,random_state&＃61;20,n_samples&＃61;500,centers&＃61;3)X &＃61; np.dot(X, np.random.RandomState(0).randn(2,2))GMM &＃61; GaussianMixture(n_components&＃61;3)GMM.fit(X)Y &＃61; np.random.randint(-10, 20, size&＃61;(1, 2))print(GMM.means_, GMM.predict_proba(Y))"""Out: [[19.88168663 17.47097164] [-12.83538784 4.89646199] [11.09673732 18.67548935]] [[1.91500946e-17 9.30483496e-01 6.95165038e-02]]"""`
GMM将样本分类为第二类。

结论
实现高斯混合模型并不难。一旦你清楚了数学&＃xff0c;它将为模型找到最大似然估计(无论是一维数据还是高维数据)。该方法具有较强的鲁棒性&＃xff0c;在执行聚类任务时非常有用。现在您已经熟悉了GMM的python实现&＃xff0c;可以使用数据集执行一些很酷的操作。

推荐阅读

sum
logistic回归（线性和非线性）的开发笔记

本文由编程笔记#小编为大家整理，主要介绍了logistic回归（线性和非线性）相关的知识，包括线性logistic回归的代码和数据集的分布情况。希望对你有一定的参考价值。 ... [详细]

蜡笔小新 2023-12-14 21:40:43
less
微软头条实习生分享深度学习自学指南

本文介绍了一位微软头条实习生自学深度学习的经验分享，包括学习资源推荐、重要基础知识的学习要点等。作者强调了学好Python和数学基础的重要性，并提供了一些建议。 ... [详细]

蜡笔小新 2023-12-14 20:58:32
select
CSS3选择器的使用方法详解，提高Web开发效率和精准度

本文详细介绍了CSS3新增的选择器方法，包括属性选择器的使用。通过CSS3选择器，可以提高Web开发的效率和精准度，使得查找元素更加方便和快捷。同时，本文还对属性选择器的各种用法进行了详细解释，并给出了相应的代码示例。通过学习本文，读者可以更好地掌握CSS3选择器的使用方法，提升自己的Web开发能力。 ... [详细]

蜡笔小新 2023-12-14 14:37:52
select
sklearn数据集库中的常用数据集类型介绍

本文介绍了sklearn数据集库中常用的数据集类型，包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集，包含了波士顿506处房屋的13种不同特征以及房屋价格，适用于回归任务。 ... [详细]

蜡笔小新 2023-12-13 17:45:15
regex
Python正则表达式学习记录及常用方法

本文记录了学习Python正则表达式的过程，介绍了re模块的常用方法re.search，并解释了rawstring的作用。正则表达式是一种方便检查字符串匹配模式的工具，通过本文的学习可以掌握Python中使用正则表达式的基本方法。 ... [详细]

蜡笔小新 2023-12-13 16:37:19
object
不同优化算法的比较分析及实验验证

本文介绍了神经网络优化中常用的优化方法，包括学习率调整和梯度估计修正，并通过实验验证了不同优化算法的效果。实验结果表明，Adam算法在综合考虑学习率调整和梯度估计修正方面表现较好。该研究对于优化神经网络的训练过程具有指导意义。 ... [详细]

蜡笔小新 2023-12-13 16:05:14
object
Python瓦片图下载、合并、绘图、标记的代码示例

本文提供了Python瓦片图下载、合并、绘图、标记的代码示例，包括下载代码、多线程下载、图像处理等功能。通过参考geoserver，使用PIL、cv2、numpy、gdal、osr等库实现了瓦片图的下载、合并、绘图和标记功能。代码示例详细介绍了各个功能的实现方法，供读者参考使用。 ... [详细]

蜡笔小新 2023-12-13 12:14:55
java
Java太阳系小游戏分析和源码详解

本文介绍了一个基于Java的太阳系小游戏的分析和源码详解。通过对面向对象的知识的学习和实践，作者实现了太阳系各行星绕太阳转的效果。文章详细介绍了游戏的设计思路和源码结构，包括工具类、常量、图片加载、面板等。通过这个小游戏的制作，读者可以巩固和应用所学的知识，如类的继承、方法的重载与重写、多态和封装等。 ... [详细]

蜡笔小新 2023-12-14 19:53:34
js
vue使用

关键词： ... [详细]

蜡笔小新 2023-12-14 19:14:56
config
Linux服务器密码过期策略、登录次数限制、私钥登录等配置方法

本文介绍了在Linux服务器上进行密码过期策略、登录次数限制、私钥登录等配置的方法。通过修改配置文件中的参数，可以设置密码的有效期、最小间隔时间、最小长度，并在密码过期前进行提示。同时还介绍了如何进行公钥登录和修改默认账户用户名的操作。详细步骤和注意事项可参考本文内容。 ... [详细]

蜡笔小新 2023-12-14 17:57:01
js
【机器学习】生成式对抗网络模型综述

生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型，可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]

蜡笔小新 2023-12-14 17:51:18
object
在类中定义数组时出错 - Error on defining arrays in class

Iamtryingtomakeaclassthatwillreadatextfileofnamesintoanarray,thenreturnthatarra ... [详细]

蜡笔小新 2023-12-14 17:38:12
bit
Android开发笔记：使用Picasso加载网络图片等比例缩放

在Android开发中，使用Picasso库可以实现对网络图片的等比例缩放。本文介绍了使用Picasso库进行图片缩放的方法，并提供了具体的代码实现。通过获取图片的宽高，计算目标宽度和高度，并创建新图实现等比例缩放。 ... [详细]

蜡笔小新 2023-12-14 17:34:00
bit
云原生边缘计算之KubeEdge简介及功能特点

本文介绍了云原生边缘计算中的KubeEdge系统，该系统是一个开源系统，用于将容器化应用程序编排功能扩展到Edge的主机。它基于Kubernetes构建，并为网络应用程序提供基础架构支持。同时，KubeEdge具有离线模式、基于Kubernetes的节点、群集、应用程序和设备管理、资源优化等特点。此外，KubeEdge还支持跨平台工作，在私有、公共和混合云中都可以运行。同时，KubeEdge还提供数据管理和数据分析管道引擎的支持。最后，本文还介绍了KubeEdge系统生成证书的方法。 ... [详细]

蜡笔小新 2023-12-14 16:49:01
js
关于cuowu类的错误提示和使用AdjustmentListener的问题

本文讨论了一个关于cuowu类的问题，作者在使用cuowu类时遇到了错误提示和使用AdjustmentListener的问题。文章提供了16个解决方案，并给出了两个可能导致错误的原因。 ... [详细]

蜡笔小新 2023-12-13 22:09:56

皇家城市_579

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章