热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

t分布f分布与样本均值抽样分布_常见的统计分布数据分析

大纲:常见的离散型概率分布(二项,几何,超几何,泊松)常见的连续型概率分布(指数,正态,均匀)三大抽样分布(卡方,t,F)一些推论和分布之间的关系离散型分布二项分布实验重复n次,每

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

大纲:

  1. 常见的离散型概率分布(二项,几何,超几何,泊松)
  2. 常见的连续型概率分布(指数,正态,均匀)
  3. 三大抽样分布(卡方,t,F)
  4. 一些推论和分布之间的关系

离散型分布

  • 二项分布

实验重复n次,每次实验相互独立(伯努利实验),实验有两种结果,成功概率p,失败概率1-p。

在二项分布中,我们关注的是在n次试验中成功的次数(区别于几何分布)。

举个栗子:

当我们要计算抛硬币n次,恰巧有x次正面朝上的概率,可以使用二项分布的公式:

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

二项概率的数学期望为E(x) = np,方差D(x) = np(1-p)。

  • 几何分布

几何分布(英语:Geometric distribution)指的是以下两种离散型概率分布中的一种:

  • 在伯努利试验中,得到一次成功所需要的试验次数 X
  • 在得到第一次成功之前所经历的失败次数 X

n重伯努利实验

在第X次成功的概率:

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

  • 超几何分布

超几何分布是统计学上一种离散概率分布。它描述了由有限个物件中抽出n个物件,成功抽出指定种类的物件的个数(不归还 (without replacement))。

例如:从N个样本中抽取n个,N个中有r个不合格的,求抽到x个不合格样本的概率。

超几何分布的概率分布,均值和方差:

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

  • 泊松分布

泊松概率的成立条件是在任意两个长度相等的时间区间中,事件发生的概率是相同的,并且事件是否发生都是相互独立的。

x代表发生x次,u代表发生次数的数学期望,概率函数为:

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

实际计算过程中用这个公式更好理解:

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

t是你要计算的时间区间长度,t=1时即为泊松分布(单位时间),扩展后的函数是泊松过程。

泊松分布的数学期望和方差相等,因此E(x) = D(x) = λ。

连续型分布

  • 均匀分布

在取值区间内出现概率相同(常数)

概率密度函数,均值和方差:

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

  • 指数分布

指数分布是连续型概率分布!!!放在这里是因为它跟泊松分布关系密切,可以由泊松分布推导而来。

指数分布是事件的时间间隔的概率。时间间隔大于t,等同于t时间内事件次数为0的概率,而后者的概率可以由泊松过程给出。

推导过程:

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

指数分布的期望和方差:若以λ为参数,则是E(X)=1/λ D(X)=1/λ²

  • 正态分布

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

正态分布的经验法则:

均值±标准差:68.3%

均值±2标准差:95.4%

均值±3标准差:99.7%

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

抽样分布

  • 点估计和区间估计

点估计:用样本统计量估计总体参数,未给出估计的可靠程度(置信度)

区间估计:给定置信水平,以估计值为中心给出真实值可能出现的区间范围。

  • 大数定律和中心极限定理

大数定律:样本量趋近于无穷时,样本均值收敛到总体期望

中心极限定理:

1,样本均值约等于总体均值

2,抽样次数趋近于无穷时,样本均值围绕总体均值呈现正态分布(无论总体分布是否服从正态分布)

  • 标准差与标准误

标准差 = 一次抽样中个体分数间的离散程度,反映了个体分数对样本均值的代表性,用于描述统计

标准误 = 多次抽样中样本均值间的离散程度,反映了样本均值对总体均值的代表性,用于推论统计

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

  • 卡方分布

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

概率密度函数及其形状:

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

当自由度n增大时,卡方分布的概率密度函数趋于对称。

卡方分布的性质:

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

  • t分布

在讲t分布之前先了解下t检验和z检验:

  1. Z-Test 用于大样本(n>30),或总体方差已知;
  2. T-Test 在小样本(n<30),且总体方差未知时,适用性优于Z-Test,而在大样本时,T-Test 与 Z-Test 结论趋同。

单样本t统计量:由于总体标准差未知,一般用样本标准差S估计总体标准差

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

双样本t统计量:

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

t统计量的分布服从t分布。当样本量无限大时,t分布无限接近于正态分布N(0,1)。

自由度为n的t分布

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

概率密度函数及其形状:

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

t变量的性质:当n趋向于无穷大时,t变量的极限分布为N(0,1)。

  • F分布

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

概率密度函数及其图形:

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

自由度为m,n的F分布的密度函数

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

F分布的自由度mn是有顺序的, 当m≠n时, 若将自由度mn的顺序颠倒一下, 得到的是两个不同的F分布.

F变量的性质:

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

几个重要推论和分布间的关系

  • 正态变量线性函数的分布

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

  • 正态变量样本均值和样本方差的分布

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

  • 一些推论

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

参考资料:

小白都能看懂的95%置信区间_bitcarmanlee的博客-CSDN博客

https://blog.csdn.net/anshuai_aw1/article/details/82656691

《商务与经济统计》学习笔记(七)-各统计分布知识点归纳_天阑之蓝的博客-CSDN博客

如何七周成为数据分析师15:读了本文,你就懂了概率分布 | 人人都是产品经理


推荐阅读
  • 微软头条实习生分享深度学习自学指南
    本文介绍了一位微软头条实习生自学深度学习的经验分享,包括学习资源推荐、重要基础知识的学习要点等。作者强调了学好Python和数学基础的重要性,并提供了一些建议。 ... [详细]
  • 云原生边缘计算之KubeEdge简介及功能特点
    本文介绍了云原生边缘计算中的KubeEdge系统,该系统是一个开源系统,用于将容器化应用程序编排功能扩展到Edge的主机。它基于Kubernetes构建,并为网络应用程序提供基础架构支持。同时,KubeEdge具有离线模式、基于Kubernetes的节点、群集、应用程序和设备管理、资源优化等特点。此外,KubeEdge还支持跨平台工作,在私有、公共和混合云中都可以运行。同时,KubeEdge还提供数据管理和数据分析管道引擎的支持。最后,本文还介绍了KubeEdge系统生成证书的方法。 ... [详细]
  • 阿里Treebased Deep Match(TDM) 学习笔记及技术发展回顾
    本文介绍了阿里Treebased Deep Match(TDM)的学习笔记,同时回顾了工业界技术发展的几代演进。从基于统计的启发式规则方法到基于内积模型的向量检索方法,再到引入复杂深度学习模型的下一代匹配技术。文章详细解释了基于统计的启发式规则方法和基于内积模型的向量检索方法的原理和应用,并介绍了TDM的背景和优势。最后,文章提到了向量距离和基于向量聚类的索引结构对于加速匹配效率的作用。本文对于理解TDM的学习过程和了解匹配技术的发展具有重要意义。 ... [详细]
  • 在Android开发中,使用Picasso库可以实现对网络图片的等比例缩放。本文介绍了使用Picasso库进行图片缩放的方法,并提供了具体的代码实现。通过获取图片的宽高,计算目标宽度和高度,并创建新图实现等比例缩放。 ... [详细]
  • 浏览器中的异常检测算法及其在深度学习中的应用
    本文介绍了在浏览器中进行异常检测的算法,包括统计学方法和机器学习方法,并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测,可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率,而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]
  • 深度学习中的Vision Transformer (ViT)详解
    本文详细介绍了深度学习中的Vision Transformer (ViT)方法。首先介绍了相关工作和ViT的基本原理,包括图像块嵌入、可学习的嵌入、位置嵌入和Transformer编码器等。接着讨论了ViT的张量维度变化、归纳偏置与混合架构、微调及更高分辨率等方面。最后给出了实验结果和相关代码的链接。本文的研究表明,对于CV任务,直接应用纯Transformer架构于图像块序列是可行的,无需依赖于卷积网络。 ... [详细]
  • 本文由编程笔记#小编整理,主要介绍了关于数论相关的知识,包括数论的算法和百度百科的链接。文章还介绍了欧几里得算法、辗转相除法、gcd、lcm和扩展欧几里得算法的使用方法。此外,文章还提到了数论在求解不定方程、模线性方程和乘法逆元方面的应用。摘要长度:184字。 ... [详细]
  • Linux服务器密码过期策略、登录次数限制、私钥登录等配置方法
    本文介绍了在Linux服务器上进行密码过期策略、登录次数限制、私钥登录等配置的方法。通过修改配置文件中的参数,可以设置密码的有效期、最小间隔时间、最小长度,并在密码过期前进行提示。同时还介绍了如何进行公钥登录和修改默认账户用户名的操作。详细步骤和注意事项可参考本文内容。 ... [详细]
  • EPICS Archiver Appliance存储waveform记录的尝试及资源需求分析
    本文介绍了EPICS Archiver Appliance存储waveform记录的尝试过程,并分析了其所需的资源容量。通过解决错误提示和调整内存大小,成功存储了波形数据。然后,讨论了储存环逐束团信号的意义,以及通过记录多圈的束团信号进行参数分析的可能性。波形数据的存储需求巨大,每天需要近250G,一年需要90T。然而,储存环逐束团信号具有重要意义,可以揭示出每个束团的纵向振荡频率和模式。 ... [详细]
  • CSS3选择器的使用方法详解,提高Web开发效率和精准度
    本文详细介绍了CSS3新增的选择器方法,包括属性选择器的使用。通过CSS3选择器,可以提高Web开发的效率和精准度,使得查找元素更加方便和快捷。同时,本文还对属性选择器的各种用法进行了详细解释,并给出了相应的代码示例。通过学习本文,读者可以更好地掌握CSS3选择器的使用方法,提升自己的Web开发能力。 ... [详细]
  • 本文介绍了Java工具类库Hutool,该工具包封装了对文件、流、加密解密、转码、正则、线程、XML等JDK方法的封装,并提供了各种Util工具类。同时,还介绍了Hutool的组件,包括动态代理、布隆过滤、缓存、定时任务等功能。该工具包可以简化Java代码,提高开发效率。 ... [详细]
  • 使用Ubuntu中的Python获取浏览器历史记录原文: ... [详细]
  • 本文介绍了P1651题目的描述和要求,以及计算能搭建的塔的最大高度的方法。通过动态规划和状压技术,将问题转化为求解差值的问题,并定义了相应的状态。最终得出了计算最大高度的解法。 ... [详细]
  • 无损压缩算法专题——LZSS算法实现
    本文介绍了基于无损压缩算法专题的LZSS算法实现。通过Python和C两种语言的代码实现了对任意文件的压缩和解压功能。详细介绍了LZSS算法的原理和实现过程,以及代码中的注释。 ... [详细]
  • 海马s5近光灯能否直接更换为H7?
    本文主要介绍了海马s5车型的近光灯是否可以直接更换为H7灯泡,并提供了完整的教程下载地址。此外,还详细讲解了DSP功能函数中的数据拷贝、数据填充和浮点数转换为定点数的相关内容。 ... [详细]
author-avatar
十分风格的功夫_723
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有