热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

建立概率统计思维,还原事物的本质

1、打开手机的天气预报软件,我们除了能看到明天是晴天还是雨天,还可以看到具体的降雨概率,比如明天10点的降雨概率是60%。随着技术水平的提高,天气预报的准确率越来越高,我们就可以根

1、

打开手机的天气预报软件,我们除了能看到明天是晴天还是雨天,还可以看到具体的降雨概率,比如明天10点的降雨概率是60%。随着技术水平的提高,天气预报的准确率越来越高,我们就可以根据降雨概率的大小来决定明天出门要不要带伞。这只是概率在生活中的一个具体应用,其实在生活中概率无处不在。

概念

概率就是用数值表示某件事情发生的可能性。

这个数值始终介于0和1之间,概率为0 表示这件事不可能发生,概率为1表示这件事必然发生,抛一枚硬币,正面朝上的概率为1/2。

计算公式

事件A的概率=《建立概率统计思维,还原事物的本质》http://students.brown.edu/seeing-theory/basic-probability/index.html里面有一个抛骰子的游戏,可以很直观的理解大数定律和小数定律。因此,对于有志于数据分析工作的我们,一定不能掉落小数定律的陷阱,要充分考虑数据的深度和广度,防止以偏概全。

学习概率最大的收获就是,生活中的每一次决策都应该选择大概率成功的事件,在同样的努力程度下,选择一个资源更丰富的环境,可以提高自己的成功概率。

2、描述统计学

相对于枯燥的数字,人们更喜欢直观的描述,而数据分析师要做的就是在一大堆数字里找出规律,并用简单的几个数据和图标展示给大家,在这背后就会用到统计学的知识。

其中常用的指标有平均值、四分位数、标准差、标准分。

平均值,很好理解,就是一组数据的算术和除以数据个数,但是不要被平均数欺骗了,因为很可能这一组数据中,最小的和最大的数之间差距会很大。比如,当我们的财富被马云平均时,我们瞬间会成为亿万富翁。

四分位数,在计算四分位数之前,先找到中位数。首先将一组数据从小到大排列,如果数据总数n为奇数,则中位数就是位于中间位置的数值;如果n为偶数,则中位数就是中间两个数的平均值。而四分位数就是除去中位数后的前半部分数据的中位数——下四分位数,后半部分数据的中位数——上四分位数。借用课程中的一幅图就能很好理解了。

《建立概率统计思维,还原事物的本质》
《建立概率统计思维,还原事物的本质》

箱线图可以把一组数据的最小值,最大值,上四分位数,中位数,下四分位数分别反映在一副图中,通过不同数据组的对比,可以很清晰的发现其中的差距。

《建立概率统计思维,还原事物的本质》
《建立概率统计思维,还原事物的本质》

标准差,反映数据偏离平均值的程度,数值越大,说明数据波动越大,越不稳定。用 《建立概率统计思维,还原事物的本质》
《建立概率统计思维,还原事物的本质》

课程的学习中,在理解质量管理中6 《建立概率统计思维,还原事物的本质》 时有点困难。六西格玛反映百万抽样中只有3.4个不合格,说明产品质量很稳定。根据计算公式,我以为要得到更大的标准分,数据就应该偏离平均数越大,这样反而质量更不好。后来才意识到,分母部分的标准差越小,标准分越大,说明数据波动越小,质量越稳定。

在实际应用时,抓取财经网站的股票数据,理解各种统计指标的含义,并用图示分析股票的走势,跟着课程中的代码在notebook中敲了一遍,感受到了python的强大。在这个过程中被一段读取网站的数据的代码卡住了,一直运行不出想要的结果。后来,寻求社群成员的帮助后,在猴子老师提供的课程资料中找到了解决办法。在以后的学习中,除了认真听课程中的内容,还要经常关注课程资料。

小结

建立概率统计思维可以让繁杂的数据变得有序,能更直观反映出客观事实,有时候需要一大段话才能说明白的事情,只要一个统计指标就可以搞定,这就是数据分析最厉害的地方,一切用数字说话,直达事物的本质。


推荐阅读
  • 微软头条实习生分享深度学习自学指南
    本文介绍了一位微软头条实习生自学深度学习的经验分享,包括学习资源推荐、重要基础知识的学习要点等。作者强调了学好Python和数学基础的重要性,并提供了一些建议。 ... [详细]
  • 如何实现织梦DedeCms全站伪静态
    本文介绍了如何通过修改织梦DedeCms源代码来实现全站伪静态,以提高管理和SEO效果。全站伪静态可以避免重复URL的问题,同时通过使用mod_rewrite伪静态模块和.htaccess正则表达式,可以更好地适应搜索引擎的需求。文章还提到了一些相关的技术和工具,如Ubuntu、qt编程、tomcat端口、爬虫、php request根目录等。 ... [详细]
  • 阿里Treebased Deep Match(TDM) 学习笔记及技术发展回顾
    本文介绍了阿里Treebased Deep Match(TDM)的学习笔记,同时回顾了工业界技术发展的几代演进。从基于统计的启发式规则方法到基于内积模型的向量检索方法,再到引入复杂深度学习模型的下一代匹配技术。文章详细解释了基于统计的启发式规则方法和基于内积模型的向量检索方法的原理和应用,并介绍了TDM的背景和优势。最后,文章提到了向量距离和基于向量聚类的索引结构对于加速匹配效率的作用。本文对于理解TDM的学习过程和了解匹配技术的发展具有重要意义。 ... [详细]
  • 云原生边缘计算之KubeEdge简介及功能特点
    本文介绍了云原生边缘计算中的KubeEdge系统,该系统是一个开源系统,用于将容器化应用程序编排功能扩展到Edge的主机。它基于Kubernetes构建,并为网络应用程序提供基础架构支持。同时,KubeEdge具有离线模式、基于Kubernetes的节点、群集、应用程序和设备管理、资源优化等特点。此外,KubeEdge还支持跨平台工作,在私有、公共和混合云中都可以运行。同时,KubeEdge还提供数据管理和数据分析管道引擎的支持。最后,本文还介绍了KubeEdge系统生成证书的方法。 ... [详细]
  • 本文是一位90后程序员分享的职业发展经验,从年薪3w到30w的薪资增长过程。文章回顾了自己的青春时光,包括与朋友一起玩DOTA的回忆,并附上了一段纪念DOTA青春的视频链接。作者还提到了一些与程序员相关的名词和团队,如Pis、蛛丝马迹、B神、LGD、EHOME等。通过分享自己的经验,作者希望能够给其他程序员提供一些职业发展的思路和启示。 ... [详细]
  • 本文讨论了Alink回归预测的不完善问题,指出目前主要针对Python做案例,对其他语言支持不足。同时介绍了pom.xml文件的基本结构和使用方法,以及Maven的相关知识。最后,对Alink回归预测的未来发展提出了期待。 ... [详细]
  • 2018年人工智能大数据的爆发,学Java还是Python?
    本文介绍了2018年人工智能大数据的爆发以及学习Java和Python的相关知识。在人工智能和大数据时代,Java和Python这两门编程语言都很优秀且火爆。选择学习哪门语言要根据个人兴趣爱好来决定。Python是一门拥有简洁语法的高级编程语言,容易上手。其特色之一是强制使用空白符作为语句缩进,使得新手可以快速上手。目前,Python在人工智能领域有着广泛的应用。如果对Java、Python或大数据感兴趣,欢迎加入qq群458345782。 ... [详细]
  • 本文介绍了使用CentOS7.0 U盘刻录工具进行安装的详细步骤,包括使用USBWriter工具刻录ISO文件到USB驱动器、格式化USB磁盘、设置启动顺序等。通过本文的指导,用户可以轻松地使用U盘安装CentOS7.0操作系统。 ... [详细]
  • 如何去除Win7快捷方式的箭头
    本文介绍了如何去除Win7快捷方式的箭头的方法,通过生成一个透明的ico图标并将其命名为Empty.ico,将图标复制到windows目录下,并导入注册表,即可去除箭头。这样做可以改善默认快捷方式的外观,提升桌面整洁度。 ... [详细]
  • 本文介绍了数据库的存储结构及其重要性,强调了关系数据库范例中将逻辑存储与物理存储分开的必要性。通过逻辑结构和物理结构的分离,可以实现对物理存储的重新组织和数据库的迁移,而应用程序不会察觉到任何更改。文章还展示了Oracle数据库的逻辑结构和物理结构,并介绍了表空间的概念和作用。 ... [详细]
  • CSS3选择器的使用方法详解,提高Web开发效率和精准度
    本文详细介绍了CSS3新增的选择器方法,包括属性选择器的使用。通过CSS3选择器,可以提高Web开发的效率和精准度,使得查找元素更加方便和快捷。同时,本文还对属性选择器的各种用法进行了详细解释,并给出了相应的代码示例。通过学习本文,读者可以更好地掌握CSS3选择器的使用方法,提升自己的Web开发能力。 ... [详细]
  • 本文介绍了Java工具类库Hutool,该工具包封装了对文件、流、加密解密、转码、正则、线程、XML等JDK方法的封装,并提供了各种Util工具类。同时,还介绍了Hutool的组件,包括动态代理、布隆过滤、缓存、定时任务等功能。该工具包可以简化Java代码,提高开发效率。 ... [详细]
  • android listview OnItemClickListener失效原因
    最近在做listview时发现OnItemClickListener失效的问题,经过查找发现是因为button的原因。不仅listitem中存在button会影响OnItemClickListener事件的失效,还会导致单击后listview每个item的背景改变,使得item中的所有有关焦点的事件都失效。本文给出了一个范例来说明这种情况,并提供了解决方法。 ... [详细]
  • “你永远都不知道明天和‘公司的意外’哪个先来。”疫情期间,这是我们最战战兢兢的心情。但是显然,有些人体会不了。这份行业数据,让笔者“柠檬” ... [详细]
  • 本文详细介绍了Linux中进程控制块PCBtask_struct结构体的结构和作用,包括进程状态、进程号、待处理信号、进程地址空间、调度标志、锁深度、基本时间片、调度策略以及内存管理信息等方面的内容。阅读本文可以更加深入地了解Linux进程管理的原理和机制。 ... [详细]
author-avatar
常德锦江-余欢
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有