热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

GMM与KDE区别与联系

GMM与KDE区别与联系对拿到的一堆数据,可以通过KDE方法来估计概率密度,Parzen窗方法通过使用不同的窗口作为基底,用函数逼近的思路

GMM 与 KDE 区别与联系


对拿到的一堆数据,可以通过KDE方法来估计概率密度,Parzen 窗方法通过使用不同的窗口作为基底,用函数逼近的思路来逼近真实的分布函数,混合高斯模型,同样也用了多个高斯分布做了线性组合来拟合隐含的分布,看起来高斯混合模型也可以用来做概率密度估计,那么到底这两者之间是否是相似的呢?又或者有什么不同呢先来看他们各自的公式

混合高斯模型:

其中 N 表示 Component 的个数,也就是由多少个高斯分布来进行混合,表示每一个Component的权重,它是一个概率意义上的量,代表了一个观测数据由第i个Component生成的概率,因此

其中, 代表了第k个Component的概率密度函数

从这个公式上面可以看到,一般高斯混合模型的用途是用来做分类判别用,第k个Component代表了第k类,如果我们已经有了第k类的信息,那么我们就可以判定一个数据是属于第k类的概率,这个概率值就是,因此对K个可能的分类,我们就会得到把当前的数据分类到第k类的概率为

用高斯模型的线性组合来拟合未知的分布,有研究表明有过拟合的问题存在,物理意义并不明显,不像KDE有窗的概念,有窗的宽度等东西,因此他们的解释是不一样的

KDE 的概念是从直方图的概率中过度来的,我们看看KDE的定义是如何得到的

我们以一维的情况来举例,假设在某未知分布下,观测了N次得到N个结果,这是为了保证这N个数据是独立同分布的。我们考察一个给定的区间R在这N个数据中,有K个落在R中的情况,很明显,这属于二项分布的情况

k 的期望值是

其中P是,

可以这么来理解k的期望,就是一共有N个数据,区间R中有k个的平均值就是nP,这是二项分布的特点 ,因此因此我们可以用下面的公式来估计k

对这个公式进行一下变形,得到如下公式


这就可以是k的一个概率估计,当样本数n很大的时候,这个估计就越准确

现在假设区域R足够小,然后在R的这个小区域里面,p(x)的值变化都非常小,可以近似相等,那么在R中取值,我们可以计算这个R区间内的面积,也就是有k个数据在R中的概率

这里的R本身就代表了区间的长度,但是为了扩展到更高纬度的方便,这里用体积V来表示,一维的情况下是长度,二维情况下是面积,三维情况下是体积,对N维情况下就要用到测度来表示了,测度其实就是一种更严格的定义的关于不同维度下的“体积“的一种度量。

为了得到概率密度的表达式,我们只需要把上面等式的后面部分做一个变形就可以得到:

现在来看这里得到的理论结果:假设有一系列包含x的区域,对采用一个样本进行估计,对采用两个样本进行估计,对采用n个样本进行估计,也就是逐渐增加样本个数的方式来构建区域。的体积,的第n次估计,有下面的结论:




则,收敛于两种选择方法

  1. 选择 比如同时对加限制以保障收敛,此法称为Parzen窗方法
  2. 选择 比如,为正好包含x的个近邻,此法为近邻估计

Parzen 窗方法

概率密度的估计公式为:,设区域是以为棱长的d维超立方体,则立方体的体积为:

定义一个窗函数,

求出落入超立方体的样本个数
如果某一样本落入该超立方体,则有,否则落入该立方体的样本数点x的概率密度为:

现在我们来对比高斯混合模型和parzen 窗方法的公式
可以看出,有两个地方不同,第一,窗的选择不同,Parzen的选择有更明确的物理意义,高斯混合模型的窗是基于函数逼近理论选择出来的,第二,系数不同,高斯混合模型需要数据来训练得出系数,Parzen 窗方法有明确的物理意义。其实如果Parzen 选择高斯窗口,样子看起来更像高斯混合模型。一般来说,高斯混合模型更多的用于分类,Parzen等KDE方法更多的用于概率密度的估计。两个方法的意义不一样。

引用 http://www.doc88.com/p-8109915473355.html
         http://www.doc88.com/p-8059993777655.html



推荐阅读
  • GetWindowLong函数
    今天在看一个代码里头写了GetWindowLong(hwnd,0),我当时就有点费解,靠,上网搜索函数原型说明,死活找不到第 ... [详细]
  • Monkey《大话移动——Android与iOS应用测试指南》的预购信息发布啦!
    Monkey《大话移动——Android与iOS应用测试指南》的预购信息已经发布,可以在京东和当当网进行预购。感谢几位大牛给出的书评,并呼吁大家的支持。明天京东的链接也将发布。 ... [详细]
  • 本文介绍了使用CentOS7.0 U盘刻录工具进行安装的详细步骤,包括使用USBWriter工具刻录ISO文件到USB驱动器、格式化USB磁盘、设置启动顺序等。通过本文的指导,用户可以轻松地使用U盘安装CentOS7.0操作系统。 ... [详细]
  • EPICS Archiver Appliance存储waveform记录的尝试及资源需求分析
    本文介绍了EPICS Archiver Appliance存储waveform记录的尝试过程,并分析了其所需的资源容量。通过解决错误提示和调整内存大小,成功存储了波形数据。然后,讨论了储存环逐束团信号的意义,以及通过记录多圈的束团信号进行参数分析的可能性。波形数据的存储需求巨大,每天需要近250G,一年需要90T。然而,储存环逐束团信号具有重要意义,可以揭示出每个束团的纵向振荡频率和模式。 ... [详细]
  • Nginx使用(server参数配置)
    本文介绍了Nginx的使用,重点讲解了server参数配置,包括端口号、主机名、根目录等内容。同时,还介绍了Nginx的反向代理功能。 ... [详细]
  • 云原生边缘计算之KubeEdge简介及功能特点
    本文介绍了云原生边缘计算中的KubeEdge系统,该系统是一个开源系统,用于将容器化应用程序编排功能扩展到Edge的主机。它基于Kubernetes构建,并为网络应用程序提供基础架构支持。同时,KubeEdge具有离线模式、基于Kubernetes的节点、群集、应用程序和设备管理、资源优化等特点。此外,KubeEdge还支持跨平台工作,在私有、公共和混合云中都可以运行。同时,KubeEdge还提供数据管理和数据分析管道引擎的支持。最后,本文还介绍了KubeEdge系统生成证书的方法。 ... [详细]
  • 这是原文链接:sendingformdata许多情况下,我们使用表单发送数据到服务器。服务器处理数据并返回响应给用户。这看起来很简单,但是 ... [详细]
  • 如何去除Win7快捷方式的箭头
    本文介绍了如何去除Win7快捷方式的箭头的方法,通过生成一个透明的ico图标并将其命名为Empty.ico,将图标复制到windows目录下,并导入注册表,即可去除箭头。这样做可以改善默认快捷方式的外观,提升桌面整洁度。 ... [详细]
  • 本文介绍了使用AJAX的POST请求实现数据修改功能的方法。通过ajax-post技术,可以实现在输入某个id后,通过ajax技术调用post.jsp修改具有该id记录的姓名的值。文章还提到了AJAX的概念和作用,以及使用async参数和open()方法的注意事项。同时强调了不推荐使用async=false的情况,并解释了JavaScript等待服务器响应的机制。 ... [详细]
  • 本文介绍了数据库的存储结构及其重要性,强调了关系数据库范例中将逻辑存储与物理存储分开的必要性。通过逻辑结构和物理结构的分离,可以实现对物理存储的重新组织和数据库的迁移,而应用程序不会察觉到任何更改。文章还展示了Oracle数据库的逻辑结构和物理结构,并介绍了表空间的概念和作用。 ... [详细]
  • 本文是一位90后程序员分享的职业发展经验,从年薪3w到30w的薪资增长过程。文章回顾了自己的青春时光,包括与朋友一起玩DOTA的回忆,并附上了一段纪念DOTA青春的视频链接。作者还提到了一些与程序员相关的名词和团队,如Pis、蛛丝马迹、B神、LGD、EHOME等。通过分享自己的经验,作者希望能够给其他程序员提供一些职业发展的思路和启示。 ... [详细]
  • 本文介绍了Java工具类库Hutool,该工具包封装了对文件、流、加密解密、转码、正则、线程、XML等JDK方法的封装,并提供了各种Util工具类。同时,还介绍了Hutool的组件,包括动态代理、布隆过滤、缓存、定时任务等功能。该工具包可以简化Java代码,提高开发效率。 ... [详细]
  • android listview OnItemClickListener失效原因
    最近在做listview时发现OnItemClickListener失效的问题,经过查找发现是因为button的原因。不仅listitem中存在button会影响OnItemClickListener事件的失效,还会导致单击后listview每个item的背景改变,使得item中的所有有关焦点的事件都失效。本文给出了一个范例来说明这种情况,并提供了解决方法。 ... [详细]
  • 本文讨论了Alink回归预测的不完善问题,指出目前主要针对Python做案例,对其他语言支持不足。同时介绍了pom.xml文件的基本结构和使用方法,以及Maven的相关知识。最后,对Alink回归预测的未来发展提出了期待。 ... [详细]
  • Oracle Database 10g许可授予信息及高级功能详解
    本文介绍了Oracle Database 10g许可授予信息及其中的高级功能,包括数据库优化数据包、SQL访问指导、SQL优化指导、SQL优化集和重组对象。同时提供了详细说明,指导用户在Oracle Database 10g中如何使用这些功能。 ... [详细]
author-avatar
mobiledu2502889521
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有