热门标签 | HotTags
当前位置:  开发笔记 > 程序员 > 正文

从正态分布到T检验

1.说明接上次的《几种常见的数学分布》。这次说说T分布和T检验,用词不够严谨,大家就领会精神为主吧~2.什么是抽样如果整体

1. 说明

 接上次的《几种常见的数学分布》。这次说说T分布和T检验,用词不够严谨,大家就领会精神为主吧~


2. 什么是抽样

 如果整体样本可以一个一个判断叫普查,如果整体样本太多,没法一个一个判断,只能取一部分代表整体,叫抽样。

 比如说,一个班有20个人,我们可以把所有人的身高加一起,除以人数,计算均值,如果有2000000人,就无法把所有人身高都统计一遍再除以总数,一般情况下,就是取其中一部分,计算其均值,认为他们能代表全部。


3. 正态分布

 先复习一下正态分布,比如说女人的身高一般在160左右,150, 170的比较少,140,180的更少,把身高当做横轴,人数作为纵轴画图,就可看到一个中间高两边低的钟形曲线,也就是正态分布。

 那什么不是正态分布呢?比如人的空腹血糖一般在4-6之间,而血糖高的7,8,9的很多,而低到3,2,1的就很少,不样一边多一边少的,就不是正态分布。


4. 正态分布和T分布

 如果只有20个人画一下算一下,就是正态分布;如果有2000000人,从中随机取出20个,画一图也就钟形,就叫T分布。它俩的不同就在于,一个是抽样的,一个是全体的。规律都是中间高两边低对称的样子。当取样趋于无穷大时,T分布就是正态分布,但一般都没法取太多。


5. 假设检验

 如果有2000000个女的,你认为她们的身高是正态分布,均值160(称理论值或标准值μ0),然后从中随机选了20个人,平均身高161(μ),标准差为5(上下浮动),那她们是否适合你所定义的正态分布均值160的规律呢?

 由样本信息对相应总体的特征进行推断称为统计推断。若对所估计的总体首先提出一个假设(平均身高160),然后通过样本数据(20个人)去推断是否拒绝这一假设,称为假设检验,如果符合这个假设就是H0(无效假设null hypothesis),如果不符合就是H1(备择假设alternative hypothesis)。


6. T检验

 以T分布为基础的检验叫T检验。这里主要是判断一组样本是否符合我们设定的“统计推断”。 将上例中的值代入公式,如果这20人的平均身高为161,求t值。

 如果这20人的平均身高为164

 

 

 可以看出t值的大小与抽样的均值161,标准差5,样本数20,以及统计推断160相关。


7. 如何查表

 H0成立时t服从自由度v=n-1=19的t分布,查表如下:

 上面的0.05和0.025又是什么呢?是p值(p-value),p=0.05意味着样本统计有95%的信心拒绝原假设,就是说p越小,原假设越可能被拒绝,一般p设成0.05,自由度19时,它对应的t值为2.093。

 当采样的20人平均身高为161时,t=0.894<2.093,即H0成立(抽样符合假设),当平均身高为164时,t=3.578>2.093,则H1成立(即这组抽样不符合假设)。

 就是说t差得越多,t是因为误差造成的可能性p越小,既然不是因为误差,那就是因为本质不同,所以不符合假设。


8. 单侧和双侧检验

 那上边为什么还有0.05和0.1的差别呢?它分别对应单侧和双侧检验。 理论值μ0(160),抽样均值μ(161)。

双测检验值:
μ≠μ0 (μ >μ0或μ<μ0)
单测检验值:
μ>μ0 (根据专业角度,μ不可能小于μ0)
μ<μ0 (根据专业角度,μ不可能大于μ0)

 通常我们用的都是双侧t检验,上例中用的也是双边的p值0.05对应的t值。


9. T检验的应用条件

 要符合t检验的条件,才能计算t检验的统计值

(1) 必须是随机样本且相互独立

 比如抽得出自一个家庭,就只能统计这一家的,不能代表全国的。

(2) 来自正态分布的总体

 正态分布是一种特殊的T分布,判断正态分布的方法有很多,比如Shapiro- Wilk (W检验)用于3-50个的小样本,Kolmogorov-Smirnov检验(D检验)用于小于5000的样本量,大于2000可做直方图,观察是否正态分布。

(3)方差齐性

 均数比较时,要求两总体方差相等


推荐阅读
  • baresip android编译、运行教程1语音通话
    本文介绍了如何在安卓平台上编译和运行baresip android,包括下载相关的sdk和ndk,修改ndk路径和输出目录,以及创建一个c++的安卓工程并将目录考到cpp下。详细步骤可参考给出的链接和文档。 ... [详细]
  • JVM 学习总结(三)——对象存活判定算法的两种实现
    本文介绍了垃圾收集器在回收堆内存前确定对象存活的两种算法:引用计数算法和可达性分析算法。引用计数算法通过计数器判定对象是否存活,虽然简单高效,但无法解决循环引用的问题;可达性分析算法通过判断对象是否可达来确定存活对象,是主流的Java虚拟机内存管理算法。 ... [详细]
  • 如何用JNI技术调用Java接口以及提高Java性能的详解
    本文介绍了如何使用JNI技术调用Java接口,并详细解析了如何通过JNI技术提高Java的性能。同时还讨论了JNI调用Java的private方法、Java开发中使用JNI技术的情况以及使用Java的JNI技术调用C++时的运行效率问题。文章还介绍了JNIEnv类型的使用方法,包括创建Java对象、调用Java对象的方法、获取Java对象的属性等操作。 ... [详细]
  • 本文讨论了在VMWARE5.1的虚拟服务器Windows Server 2008R2上安装oracle 10g客户端时出现的问题,并提供了解决方法。错误日志显示了异常访问违例,通过分析日志中的问题帧,找到了解决问题的线索。文章详细介绍了解决方法,帮助读者顺利安装oracle 10g客户端。 ... [详细]
  • 本文介绍了一个React Native新手在尝试将数据发布到服务器时遇到的问题,以及他的React Native代码和服务器端代码。他使用fetch方法将数据发送到服务器,但无法在服务器端读取/获取发布的数据。 ... [详细]
  • 恶意软件分析的最佳编程语言及其应用
    本文介绍了学习恶意软件分析和逆向工程领域时最适合的编程语言,并重点讨论了Python的优点。Python是一种解释型、多用途的语言,具有可读性高、可快速开发、易于学习的特点。作者分享了在本地恶意软件分析中使用Python的经验,包括快速复制恶意软件组件以更好地理解其工作。此外,作者还提到了Python的跨平台优势,使得在不同操作系统上运行代码变得更加方便。 ... [详细]
  • 本文介绍了关系型数据库和NoSQL数据库的概念和特点,列举了主流的关系型数据库和NoSQL数据库,同时描述了它们在新闻、电商抢购信息和微博热点信息等场景中的应用。此外,还提供了MySQL配置文件的相关内容。 ... [详细]
  • 本文详细介绍了Android中的坐标系以及与View相关的方法。首先介绍了Android坐标系和视图坐标系的概念,并通过图示进行了解释。接着提到了View的大小可以超过手机屏幕,并且只有在手机屏幕内才能看到。最后,作者表示将在后续文章中继续探讨与View相关的内容。 ... [详细]
  • 本文概述了JNI的原理以及常用方法。JNI提供了一种Java字节码调用C/C++的解决方案,但引用类型不能直接在Native层使用,需要进行类型转化。多维数组(包括二维数组)都是引用类型,需要使用jobjectArray类型来存取其值。此外,由于Java支持函数重载,根据函数名无法找到对应的JNI函数,因此介绍了JNI函数签名信息的解决方案。 ... [详细]
  • 本文是一篇翻译文章,介绍了async/await的用法和特点。async关键字被放置在函数前面,意味着该函数总是返回一个promise。文章还提到了可以显式返回一个promise的方法。该特性使得async/await更易于理解和使用。本文还提到了一些可能的错误,并希望读者能够指正。 ... [详细]
  • 本文介绍了在Android Studio中使用命令行build gradle的方法,并解决了一些常见问题,包括手动配置gradle环境变量和解决External Native Build Issues的方法。同时提供了相关参考文章链接。 ... [详细]
  • PeopleSoft安装镜像版本及导入语言包的方法
    本文介绍了PeopleSoft安装镜像的两个版本,分别是VirtualBox虚拟机版本和NativeOS版本,并详细说明了导入语言包的方法。对于Windows版本,可以通过psdmt.exe登录进入,并使用datamover脚本导入语言包。对于Linux版本,同样可以使用命令行方式执行datamover脚本导入语言包。导入语言包后,可以实现多种语言的登录。参考文献提供了相关链接以供深入了解。 ... [详细]
  • Mono为何能跨平台
    概念JIT编译(JITcompilation),运行时需要代码时,将Microsoft中间语言(MSIL)转换为机器码的编译。CLR(CommonLa ... [详细]
  • Question该提问来源于开源项目:react-native-device-info/react-native-device-info ... [详细]
  • mysqldinitializeconsole失败_mysql03误删除了所有用户解决办法
    误删除了所有用户解决办法第一种方法(企业常用)1.将数据库down掉[rootdb03mysql]#etcinit.dmysqldstopShuttingdownMySQL..SU ... [详细]
author-avatar
幸福的妈妈88
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有