7赞
290
当前位置:  开发笔记 > 编程语言 > 正文

一起啃PRML1.2.4TheGaussiandistribution高斯分布正态分布

一起啃PRML-1.2.4TheGaussiandistribution高斯分布正态分布@copyright转载请注明出处 http:www.cnblogs.comchxer我们将

一起啃PRML - 1.2.4 The Gaussian distribution 高斯分布 正态分布

@copyright 转载请注明出处 http://www.cnblogs.com/chxer/  

 

我们将用整个第二章来研究各种各样的概率分布以及它们的性质。然而,在这里介绍连续变量一种最重要的概率分布是很方便的。这种分布就是正态分布(normal distribution)或者高斯分布(Gaussian distribution)。在其余章节中(事实上在整本书中),我们将会经常用到这种分布。 

 

正态分布是这么定义的:

技术分享 

图像长成这样:

技术分享

我们待会被数学折磨完后再来了解这些参数的意义。

先来看看正态分布几个性质:全正且归一

技术分享

技术分享 

好,接下来我们来算一下正态分布的期望以及二阶矩的期望以及方差。

先从简单的一阶期望开始:

技术分享

然后我们就磨出来了,喜大普奔。

二阶矩似乎道理是一样的。以后再补上吧。

技术分享

那么我们就把方差求出来了:

技术分享

现在我们就知道每一个参数的意义了:

μ,被叫做均值(mean),以及σ2,被叫做方差(variance)。方差的平方 根,由σ给定,被叫做标准(standard deviation)。方差的倒数,记作β = 1 ,被叫做精度。

 

分布的最大值是众数。对于正态分布来说,众数是等于均值的。

我们也对D维向量x的正态分布感兴趣(不包括我),它是这么定义的:

技术分享

现在假定我们有一个观测的数据集x = (x1, . . . , xN )T ,表示标量变量x的N次观测。注意, 我们使用一个字体不同的x来和向量变量(x1, . . . , xD)T 作区分,后者记作x。我们假定各次观 测是独立地从高分布中抽取的,分布的均值μ和方差σ2未知,我们想根据数据集来确定这 参数。独立地从相同的数据中抽取的数据点被称为独立同分布(independent and identically distributed),通常缩写成i.i.d.。我们已看到两个独立事件的联合概率可以由各个事件的边缘概率的乘积得到。由于我们的数据集x是独立同布的,因此给定μ和σ2,我们可以给出数据集的概率:

技术分享 

我们就得到了正态分布的似然函数。我们取对数就可以得到对数似然函数:

技术分享

我们分别关于两个参数最大化对数似然函数,就得到了样本均值和样本方差:

技术分享  技术分享

事实上,我们发现样本均值应该是无偏的,也就是有:

技术分享

对于样本方差,我们则需要考量。

技术分享 

当数据点的数量N增大时,最大似然解的偏移会变得不太严重,并且在极 限N → ∞的情况下,方差的最大似然解与产生数据的分布的真实方差相等。在实际应用中,只要N 的值不太小,那么偏移的现象不是个大问题。然而,在本书中,我们感兴趣的是带有很多参数的复杂模型。这些模型中,最大似然的偏移问题会更加严重。实际上,我们会看到,最大似然的偏移问题是我们在多项式曲线拟合问题中遇到的过拟合问题的核心。 

一起啃PRML - 1.2.4 The Gaussian distribution 高斯分布 正态分布


推荐阅读
  • ContactsAcore进程,在内存较少和开机进程过多的情况下会常常被ActivityManagerKill掉。导致Sim卡联系人开机后未导入或者仅仅导入一部分,造成联系人丢失的 ... [详细]
  • 08动作系统(二)使用即时动作
    前一篇文章大致理解了动作系统的结构,今天先学习一个简单的即时动作如何使用。首先使用配置好的环境创建一个项目DemoActionInstant命令:python create_pr ... [详细]
  • ASP.NET Core MVC 2.x 全面教程_ASP.NET Core MVC 24. Logging
    常用的诊断中间件:UseDeveloperExceptionPageUseStatusCodePages:返回400~600的状态码UseExceptionHandler自定义异常 ... [详细]
  • 1.遍历map的几种方式:privateHashtableemailsnewHashtable();方法一:用entry ... [详细]
  • 第一章:1.时间估算。2.“抽签”优化3.AntsPoj1852的思考过程第二章:1.next_permutation函数2.栈内存和堆内存——关于内存抽象。 *3.BestCow ... [详细]
  • Appium是移动端的自动化测试工具,类似于前面提到的Selenium。利用Appium可以驱动Android、iOS等移动设备完成自动化测试,例如模拟点击、滑动、输入等操作。不过 ... [详细]
  • 函数一、函数是什么定义:函数是指一组语句的集合通过一个名字(函数名)封装起来,想要执行这个函数,只需要调用函数名即可。C中的函数叫function,java中的函数叫method, ... [详细]
  • 经验证此方法比较保险@Override protectedvoidonDestroy(){TODOAuto-generatedmethodstubif(webView!null){ ... [详细]
  • 转载请注明出处:王亟亟的大牛之路5号的时候把自己的老版工具类贴了出来,然后今天上午又加了一点内容进去,然后也是简单的几个Button跑下,看看效果。 新增了两个类,一个手机信息类, ... [详细]
  • http:s-macke.github.iojor1kdemosmain.html?userMP10ocGujo&cpuasm&n1&relayURLwss%3A%2F%2Frel ... [详细]
  • 1.属性的话,含有settergetter方法,可以用点语法得到属性 2.成员变量没有settergetter方法,点语法点不出来 3.@property编译器 ... [详细]
  • 点此看题面大致题意:给你一张无向连通图,其中每条边的边权为这条边连接的两点的权值之差。每次询问两点之间是否存在两条不重复的路径,若存在则输出这两条路径上最大值的最小值。大致思路这题 ... [详细]
  • CentOS系统安装FTP服务
    安装FTP这样就会安装好了,下来我们要改一些FTP文件![]进入vsftpd.conf里面允许匿名访问改目录创建wy用户和密码![]给wy写入读取权限关闭防火墙关闭selinux重 ... [详细]
  • 比赛题解部分题目较难阴阳链归去来兮何由征手写堆三角形魔板较难搜索Aeasyproblem矩阵快速幂方程Fly字符串异或和规律自己打表可发 ... [详细]
  • 一直以来我都很少问自己,对工作满意吗?自己是否真正的了解过别人的想法?所以我是一个孤僻的人.尽管形式上我是跟别人群居在一起生活,工作.现在我是时候来反省了.每当我工作遇到困难的时候 ... [详细]
author-avatar
afagds
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有