当前位置: 开发笔记 > 编程语言 > 正文

GMM算法和Python简单实现

作者：蒲小平2502897955 | 来源：互联网 | 2023-09-23 17:15

GMM算法第一章引子假设放在你面前有5篮子鸡蛋，每个篮子有且仅有一种蛋，这些蛋表面上一模一样，就是每一种蛋涵盖有且只有一种维生素ÿ

GMM算法

第一章引子
假设放在你面前有5篮子鸡蛋&＃xff0c;每个篮子有且仅有一种蛋&＃xff0c;这些蛋表面上一模一样&＃xff0c;就是每一种蛋涵盖有且只有一种维生素&＃xff0c;分别是A、B、C、D、E。这个时候&＃xff0c;你需要估计这五个篮子的鸡蛋的平均重量μ。首先有个总的假设&＃xff1a; 假设每一种维生素的鸡蛋的重量都服从高斯分布。这个时候&＃xff0c;因为每个篮子的鸡蛋包含有且只有一种&＃xff0c;并且彼此之间相同的维生素&＃xff0c;即每个篮子的鸡蛋都服从相同的分布&＃xff0c;这个时候可以用极大似然估计去估计每一种维生素鸡蛋的平均重量。

现在问题来了: 我把那5种鸡蛋混在一起&＃xff0c;这个时候要你去估计这5中鸡蛋的平均重量和方差&＃xff1f; 仍旧假设&＃xff1a;每一种维生素的鸡蛋的重量都服从高斯分布这个时候有两个参数需要估计均值μ和方差σ。你从5中鸡蛋里面去拿一种鸡蛋&＃xff0c;每种鸡蛋被拿到的概率是呈一定分布的(不一定就是均匀分布&＃xff0c;然后概率是1/5)。假设第j中鸡蛋被拿到的概率是φ_j。

因此你有三个未知量&＃xff0c;即隐含量: φ_j、均值μ和方差σ。

现在是如果你知道类别z^(j)&＃xff0c;你就能根据极大似然估计计算其他两个隐含量。令每个鸡蛋的重量用x⁽ⁱ⁾表示&＃xff0c;x⁽ⁱ⁾服从高斯分布。。(x⁽ⁱ⁾|z⁽ⁱ⁾&＃61;j)~N(μ,σ²)

高斯混合模型(gaussian mixture model-GMM)就是上述问题的抽象模型&＃xff0c;即对于每一个样本x⁽ⁱ⁾&＃xff0c;先从k个类别中按某种分布抽取一个z⁽ⁱ⁾&＃xff0c;然后从这个类别下的高斯分布中生成一个样本x⁽ⁱ⁾

第二章 GMM数学推导
假设独立样本集是{x⁽¹⁾......x^(m)}&＃xff0c;这些样本是从k个高斯分布的数据里面抽取出来的。从k不同分布中抽取某一类别是呈某种分布,假设抽取到类别z⁽ⁱ⁾的概率是p(z⁽ⁱ⁾&＃61;j)&＃61; φ_j。因此这里面会有三个隐含变量: φ_j、均值μ和方差σ&＃xff0c;令这三个变量构成一个集合θ.

则利用极大似然估计θ就是我们非常熟悉的极大似然估计函数:

即:

就连乘变成连加&＃xff0c;取对数有:

接下来&＃xff0c;我们利用EM算法来估计这些参数。EM算法请参看(http://blog.csdn.net/u010866505/article/details/77877345).

1.       先假设我们知道样本的类别z⁽ⁱ⁾&＃xff0c;然后计算期望E&＃xff0c;即后验概率&＃xff1a;

2.       然后就是M-step&＃xff1a;

求偏导可以计算均值 μj:

在公式(1)中&＃xff0c;如果均值和方差固定的话,那么(1)式可以简化成:

、

为了计算优化(3)式&＃xff0c;而又满足一定的条件&＃xff0c;即 &＃xff0c;如果你知道大名鼎鼎的支持向量机(SVM)的优化目标函数是如何得到的话&＃xff1f;这里也就明白了。拉格朗日乘子。构造拉格朗日函数如下:

求导:

令(5)式&＃61;0&＃xff0c;计算有:

上面(6)式两边做如下处理:



因此(6)式得到如下变换:

接下来就是计算方差:对(1)公式计算方差的偏导:

接下来要计算方差的偏导&＃xff0c;因此(9)式中括号内的第一项和最后一项可以不用考虑。于是有:

令(10)式等于0&＃xff0c;可以计算得到方差的公式如下&＃xff1a;

(2)&＃43;(8)&＃43;(11)就是我们估计参数的最后的解。

第三章 GMM代码-python实现
如下是GMM算法的简单实现&＃xff0c;

#! /usr/bin/env python #! -- coding&＃61;utf-8 --#模拟两个正态分布的参数from numpy import * import numpy as np import random import copySIGMA &＃61; 6 EPS &＃61; 0.0001 #均值不同的样本 def generate_data(): Miu1 &＃61; 2Miu2 &＃61; 4sigma1 &＃61; 1sigma2 &＃61; 2alpha1 &＃61; 0.4alpha2 &＃61; 0.6N &＃61; 5000N1 &＃61; int(alpha1 * N)X &＃61; mat(zeros((N,1)))for i in range(N1):temp &＃61; random.uniform(0,0.5)X[i] &＃61; temp * sigma1 &＃43; Miu1for i in range(N-N1):temp &＃61; random.uniform(0,0.5)X[i&＃43;N1] &＃61; temp * sigma2 &＃43; Miu2return X#EM算法 def my_GMM(X):k &＃61; 2N &＃61; len(X)Miu &＃61; np.random.rand(k,1)Posterior &＃61; mat(zeros((N,k))) sigma &＃61; np.random.rand(k,1)sigma[0]&＃61;1#sigma[1]&＃61;2alpha &＃61; np.random.rand(k,1)alpha[0] &＃61; 0.1alpha[1] &＃61; 0.9dominator &＃61; 0numerator &＃61; 0#先求后验概率print sigmafor it in range(1000):for i in range(N):dominator &＃61; 0for j in range(k):dominator &＃61; dominator &＃43; np.exp(-1.0/(2.0sigma[j]) (X[i] - Miu[j])**2)#print -1.0/(2.0*sigma[j]),(X[i] - Miu[j])**2,-1.0/(2.0sigma[j]) (X[i] - Miu[j])**2,np.exp(-1.0/(2.0sigma[j]) (X[i] - Miu[j])**2)#returnfor j in range(k):numerator &＃61; np.exp(-1.0/(2.0sigma[j]) (X[i] - Miu[j])**2)Posterior[i,j] &＃61; numerator/dominator oldMiu &＃61; copy.deepcopy(Miu)oldalpha &＃61; copy.deepcopy(alpha)oldsigma &＃61; copy.deepcopy(sigma)#最大化 for j in range(k):numerator &＃61; 0dominator &＃61; 0for i in range(N):numerator &＃61; numerator &＃43; Posterior[i,j] * X[i]dominator &＃61; dominator &＃43; Posterior[i,j]Miu[j] &＃61; numerator/dominatoralpha[j] &＃61; dominator/Ntmp &＃61; 0for i in range(N):tmp &＃61; tmp &＃43; Posterior[i,j] * (X[i] - Miu[j])2#print tmp,Posterior[i,j],(X[i] - Miu[j])2 sigma[j] &＃61; tmp/dominatorprint tmp, dominator, sigma[j]if ((abs(Miu - oldMiu)).sum()

参考资料

[1]:http://www.cnblogs.com/jerrylead/archive/2011/04/06/2006936.html

推荐阅读

java
[大整数乘法] java代码实现

本文介绍了使用java代码实现大整数乘法的过程，同时也涉及到大整数加法和大整数减法的计算方法。通过分治算法来提高计算效率，并对算法的时间复杂度进行了研究。详细代码实现请参考文章链接。 ... [详细]

蜡笔小新 2023-12-13 11:21:32
java
OC学习笔记之@property和@synthesize

本文介绍了OC学习笔记中的@property和@synthesize，包括属性的定义和合成的使用方法。通过示例代码详细讲解了@property和@synthesize的作用和用法。 ... [详细]

蜡笔小新 2023-12-14 12:05:06
get
GetWindowLong函数

今天在看一个代码里头写了GetWindowLong(hwnd,0)，我当时就有点费解，靠，上网搜索函数原型说明，死活找不到第 ... [详细]

蜡笔小新 2023-12-14 17:58:15
post
Windows下配置PHP5.6的方法及注意事项

本文介绍了在Windows系统下配置PHP5.6的步骤及注意事项，包括下载PHP5.6、解压并配置IIS、添加模块映射、测试等。同时提供了一些常见问题的解决方法，如下载缺失的msvcr110.dll文件等。通过本文的指导，读者可以轻松地在Windows系统下配置PHP5.6，并解决一些常见的配置问题。 ... [详细]

蜡笔小新 2023-12-14 12:37:25
copy
不同优化算法的比较分析及实验验证

本文介绍了神经网络优化中常用的优化方法，包括学习率调整和梯度估计修正，并通过实验验证了不同优化算法的效果。实验结果表明，Adam算法在综合考虑学习率调整和梯度估计修正方面表现较好。该研究对于优化神经网络的训练过程具有指导意义。 ... [详细]

蜡笔小新 2023-12-13 16:05:14
post
java 模拟get post请求_Java后台模拟发送http的get和post请求，并测试

个人学习使用：谨慎参考1Client类importcom.thoughtworks.gauge.Step;importcom.thoughtworks.gauge.T ... [详细]

蜡笔小新 2023-12-13 14:20:23
java
Java中vector的使用详解

本文详细介绍了Java中vector的使用方法和相关知识，包括vector类的功能、构造方法和使用注意事项。通过使用vector类，可以方便地实现动态数组的功能，并且可以随意插入不同类型的对象，进行查找、插入和删除操作。这篇文章对于需要频繁进行查找、插入和删除操作的情况下，使用vector类是一个很好的选择。 ... [详细]

蜡笔小新 2023-12-13 14:14:39
post
南邮ctf-web的writeup

本文介绍了南邮ctf-web的writeup，包括签到题和md5 collision。在CTF比赛和渗透测试中，可以通过查看源代码、代码注释、页面隐藏元素、超链接和HTTP响应头部来寻找flag或提示信息。利用PHP弱类型，可以发现md5('QNKCDZO')='0e830400451993494058024219903391'和md5('240610708')='0e462097431906509019562988736854'。 ... [详细]

蜡笔小新 2023-12-13 10:58:55
post
Python SQLAlchemy库的使用方法详解

本文详细介绍了Python中使用SQLAlchemy库的方法。首先对SQLAlchemy进行了简介，包括其定义、适用的数据库类型等。然后讨论了SQLAlchemy提供的两种主要使用模式，即SQL表达式语言和ORM。针对不同的需求，给出了选择哪种模式的建议。最后，介绍了连接数据库的方法，包括创建SQLAlchemy引擎和执行SQL语句的接口。 ... [详细]

蜡笔小新 2023-12-12 15:23:06
copy
Day2列表、字典、集合操作详解

本文详细介绍了列表、字典、集合的操作方法，包括定义列表、访问列表元素、字符串操作、字典操作、集合操作、文件操作、字符编码与转码等内容。内容详实，适合初学者参考。 ... [详细]

蜡笔小新 2023-12-12 14:14:34
get
Linked List Random Node

Givenasinglylinkedlist,returnarandomnode'svaluefromthelinkedlist.Eachnodemusthavethe s ... [详细]

蜡笔小新 2023-12-12 09:09:15
post
Postgresql备份和恢复的方法及命令行操作步骤

本文介绍了使用Postgresql进行备份和恢复的方法及命令行操作步骤。通过使用pg_dump命令进行备份，pg_restore命令进行恢复，并设置-h localhost选项，可以完成数据的备份和恢复操作。此外，本文还提供了参考链接以获取更多详细信息。 ... [详细]

蜡笔小新 2023-12-11 10:17:12
python
开源Keras Faster RCNN模型介绍及代码结构解析

本文介绍了开源Keras Faster RCNN模型的环境需求和代码结构，包括FasterRCNN源码解析、RPN与classifier定义、data_generators.py文件的功能以及损失计算。同时提供了该模型的开源地址和安装所需的库。 ... [详细]

蜡笔小新 2023-12-10 17:44:07
get
Wince程序内存和存储内存的分析及作用

本文分析了Wince程序内存和存储内存的分布及作用。Wince内存包括系统内存、对象存储和程序内存，其中系统内存占用了一部分SDRAM，而剩下的30M为程序内存和存储内存。对象存储是嵌入式wince操作系统中的一个新概念，常用于消费电子设备中。此外，文章还介绍了主电源和后备电池在操作系统中的作用。 ... [详细]

蜡笔小新 2023-12-10 16:21:27
include
STL迭代器的种类及其功能介绍

本文介绍了标准模板库(STL)定义的五种迭代器的种类和功能。通过图表展示了这几种迭代器之间的关系，并详细描述了各个迭代器的功能和使用方法。其中，输入迭代器用于从容器中读取元素，输出迭代器用于向容器中写入元素，正向迭代器是输入迭代器和输出迭代器的组合。本文的目的是帮助读者更好地理解STL迭代器的使用方法和特点。 ... [详细]

蜡笔小新 2023-12-10 15:17:25

蒲小平2502897955

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章

GMM算法和Python简单实现

第三章 GMM代码-python实现 如下是GMM算法的简单实现&＃xff0c;

第三章 GMM代码-python实现
如下是GMM算法的简单实现&＃xff0c;