热门标签 | HotTags
当前位置:  开发笔记 > 人工智能 > 正文

为什么抛硬币只会出现三种情况?

在机器学习中,面对二分类问题我们经常采用逻辑回归来预测一个对象的所属类别,逻辑回归中一个经典之处就是使用逻辑函数将线性回归方程得到的结果转化成一个概率值,我们往往根据一个

        在机器学习中,面对二分类问题我们经常采用逻辑回归来预测一个对象的所属类别,逻辑回归中一个经典之处就是使用逻辑函数将线性回归方程得到的结果转化成一个概率值,我们往往根据一个阈值(比如0.5)来判断一个对象所属的类,如果预测的概率大于0.5则将其分为一类(正类),若小于0.5则判定为负类,当等于0.5时,我们往往是将其随机判定为某一类。越了解逻辑回归,越感觉到它的奇妙之处。

       我们从很小就学习到,抛一枚硬币时,要么出现反面,要么出现正面,极端情况就是硬币竖直(既不表现正面也不表现反面)。我们用随机变量X表示硬币出现的某个面,X=1表示出现正面,X=0表示硬币出现反面。这个是我们从小学到大学一直习以为常的方式。现在我们不考虑硬币竖直的情况,即认为在每一次抛硬币后,结果只会出现正面或反面,这样一来X的取值为集合{0,1}。这一切都是这么的自然。那么你是否想过,X为什么只能取0或者1呢,为什么不能取0.2,0.3等等。我们可以想象存在着这样一个硬币,它的面不止正面和反面,而存在很多很多面,这些面介于正面和反面之间,这些面在某个空间中是均匀连续变化的,即相邻面之间不存在间隙,而正面和反面是这个连续面集的两个极端面。意思就是X取值可以取[0,1]区间上的任何一个数,X此时是连续的。我们把这个硬币姑且称之为W币吧。

      我们手上现在有这么一个W币,用它来做抛硬币实验。当你抛出去之后,这个硬币应该随机出现[0,1]区间内的任意一个面。如果你不好想象这样一个W币是什么样子,那么我们这样考率一个没有重力场的实验环境。硬币抛出去之后到底哪一面会朝上?这种情况就不像有重力场的时候出现绝对的正面或反面。这时你会发现硬币可以呈现任何姿态,即当它的正面朝上时,不会绝对向上,而是与水平面呈现一定偏斜角度。角度最大是90°,此时硬盘竖直。此时,突然外加一个重力场,那么硬币立马变为水平状态,即偏斜角度变为0.在重力场的作用下,W币的最终结果面被强制转换为正面1或反面0.当W币恰好竖直向上时,此时及时外加了重力场,W币还是会竖直向上,我们只能随机判定其属于正面还是反面。。这个过程跟我们根据逻辑函数值是否大于阈值完全是相同的做法。在这个抛掷W币的过程中,重力场成为了判定W币是属于正面还是反面的映射机制。

      那么为什么我们在抛硬币过程中,硬币会时而正面,时而反面呢?我觉得任何一个现象背后都存在一些列影响着该现象的因素,如果我们能够准确、完全的将这些因素找出来,求得一个真实的方程,那么在每一次抛掷W币时,我们就能根据所有因素的取值预测W币最终会出现哪一面。那在实际抛掷硬币时,如果我想得到某个面wi,那么我们根据真实方程来计算出每一个影响因素的取值,然后在抛掷W币时设置好这些参数值,那结果必然会出现wi面。但是实际中,我们虽然常说做一个独立重复试验,但是我们永远无法做到各次独立实验的环境相同,比如空气中分子的分布、运动状态,重力场的状态、温度值、甚至硬币内部分子、电子等等的状态,这些我们都无法保证达到相同条件。这就出现了有些因素的随机取值,所以无法精确预测结果。就像在回归分析中,我们总是只能找到一些主要影响因素,而无法确定或是无法找到的因素带来的影响结果只能用统计误差表示。那么,当利用一部分主要影响因素和一个只能说接近于真实的方程来预测W币的最终结果时,我们只能预测到W比的最终面会落在哪些区间,当预测的W币的结果面落在[0,0.5)时,我们就用重力场将其强制转为反面0,反之将其转换为正面1.

     以上这些纯属我个人遐想。希望有感兴趣的朋友。

   


推荐阅读
  • 微软头条实习生分享深度学习自学指南
    本文介绍了一位微软头条实习生自学深度学习的经验分享,包括学习资源推荐、重要基础知识的学习要点等。作者强调了学好Python和数学基础的重要性,并提供了一些建议。 ... [详细]
  • 2018年人工智能大数据的爆发,学Java还是Python?
    本文介绍了2018年人工智能大数据的爆发以及学习Java和Python的相关知识。在人工智能和大数据时代,Java和Python这两门编程语言都很优秀且火爆。选择学习哪门语言要根据个人兴趣爱好来决定。Python是一门拥有简洁语法的高级编程语言,容易上手。其特色之一是强制使用空白符作为语句缩进,使得新手可以快速上手。目前,Python在人工智能领域有着广泛的应用。如果对Java、Python或大数据感兴趣,欢迎加入qq群458345782。 ... [详细]
  • 本文介绍了机器学习手册中关于日期和时区操作的重要性以及其在实际应用中的作用。文章以一个故事为背景,描述了学童们面对老先生的教导时的反应,以及上官如在这个过程中的表现。同时,文章也提到了顾慎为对上官如的恨意以及他们之间的矛盾源于早年的结局。最后,文章强调了日期和时区操作在机器学习中的重要性,并指出了其在实际应用中的作用和意义。 ... [详细]
  • 浏览器中的异常检测算法及其在深度学习中的应用
    本文介绍了在浏览器中进行异常检测的算法,包括统计学方法和机器学习方法,并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测,可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率,而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]
  • 词袋模型的通俗介绍
    词,袋, ... [详细]
  • 本文介绍了绕过WAF的XSS检测机制的方法,包括确定payload结构、测试和混淆。同时提出了一种构建XSS payload的方法,该payload与安全机制使用的正则表达式不匹配。通过清理用户输入、转义输出、使用文档对象模型(DOM)接收器和源、实施适当的跨域资源共享(CORS)策略和其他安全策略,可以有效阻止XSS漏洞。但是,WAF或自定义过滤器仍然被广泛使用来增加安全性。本文的方法可以绕过这种安全机制,构建与正则表达式不匹配的XSS payload。 ... [详细]
  • 如何使用代理服务器进行网页抓取?
    本文介绍了如何使用代理服务器进行网页抓取,并探讨了数据驱动对竞争优势的重要性。通过网页抓取,企业可以快速获取并分析大量与需求相关的数据,从而制定营销战略。同时,网页抓取还可以帮助电子商务公司在竞争对手的网站上下载数百页的有用数据,提高销售增长和毛利率。 ... [详细]
  • 本文介绍了在Python张量流中使用make_merged_spec()方法合并设备规格对象的方法和语法,以及参数和返回值的说明,并提供了一个示例代码。 ... [详细]
  • 本文详细介绍了商汤科技面试中涉及的CV算法面经内容,包括CornerNet的介绍与CornerPooling的解决方案、Mimic知识蒸馏的实现方式、MobileNet的特点、普通卷积和DW PW卷积的计算量推导、Residual结构的来源等。同时还讨论了在人脸关键点和检测中的mimic实现方式、pose对人脸关键点的提升作用、目标检测中可能遇到的问题以及处理检测类别冲突的方法。此外,还涉及了对机器学习的了解程度和相似度分析的问题。 ... [详细]
  • GPT-3发布,动动手指就能自动生成代码的神器来了!
    近日,OpenAI发布了最新的NLP模型GPT-3,该模型在GitHub趋势榜上名列前茅。GPT-3使用的数据集容量达到45TB,参数个数高达1750亿,训练好的模型需要700G的硬盘空间来存储。一位开发者根据GPT-3模型上线了一个名为debuid的网站,用户只需用英语描述需求,前端代码就能自动生成。这个神奇的功能让许多程序员感到惊讶。去年,OpenAI在与世界冠军OG战队的表演赛中展示了他们的强化学习模型,在限定条件下以2:0完胜人类冠军。 ... [详细]
  • 背景应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]
  • 本文介绍了贝叶斯垃圾邮件分类的机器学习代码,代码来源于https://www.cnblogs.com/huangyc/p/10327209.html,并对代码进行了简介。朴素贝叶斯分类器训练函数包括求p(Ci)和基于词汇表的p(w|Ci)。 ... [详细]
  • 建立分类感知器二元模型对样本数据进行分类
    本文介绍了建立分类感知器二元模型对样本数据进行分类的方法。通过建立线性模型,使用最小二乘、Logistic回归等方法进行建模,考虑到可能性的大小等因素。通过极大似然估计求得分类器的参数,使用牛顿-拉菲森迭代方法求解方程组。同时介绍了梯度上升算法和牛顿迭代的收敛速度比较。最后给出了公式法和logistic regression的实现示例。 ... [详细]
  • 数据结构与算法的重要性及基本概念、存储结构和算法分析
    数据结构与算法在编程领域中的重要性不可忽视,无论从事何种岗位,都需要掌握数据结构和算法。本文介绍了数据结构与算法的基本概念、存储结构和算法分析。其中包括线性结构、树结构、图结构、栈、队列、串、查找、排序等内容。此外,还介绍了图论算法、贪婪算法、分治算法、动态规划、随机化算法和回溯算法等高级数据结构和算法。掌握这些知识对于提高编程能力、解决问题具有重要意义。 ... [详细]
  • 前言:拿到一个案例,去分析:它该是做分类还是做回归,哪部分该做分类,哪部分该做回归,哪部分该做优化,它们的目标值分别是什么。再挑影响因素,哪些和分类有关的影响因素,哪些和回归有关的 ... [详细]
author-avatar
阳光而灿烂61
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有