热门标签 | HotTags
当前位置:  开发笔记 > 大数据 > 正文

logistic回归分析优点_数据统计的理解和应用(十三)预测模型篇之logistic回归...

专栏的前几期文章,临度简单讲解了基础统计的知识,如:两组定量资料的分析思路之t检验多组样本比较之方差分析列联表之卡方检验之后介绍了logi
84c0fbc37e268ae8b77eb4f56786778c.png

专栏的前几期文章,临度简单讲解了基础统计的知识,如:

  1. 两组定量资料的分析思路之t检验
  2. 多组样本比较之方差分析
  3. 列联表之卡方检验

之后介绍了logistic回归,如:

  1. 统计分析之logistic回归
  2. 单因素logistic回归分析案例
  3. 多因素logistic回归案例分析

我们知道logistic回归的几个作用:

  1. 探索危险因素
  2. 控制协变量,求某种因素对结局的影响
  3. 统计建模

那我们今天升华一下:

万物皆可盘,数据预未来

模型终有误,或尤建奇功

聊聊这个建模预测的过程

一般常见的统计建模为内部验证和外部验证:内部验证即把一份数据一拆为二,70%用作训练集,30%用作验证集;外部验证即为用已有的数据做模型,用其他的数据来做验证(原理都相似)。

直接上代码:先用SAS随机生成一份数据来演示,样本量1000,因变量y和自变量x1-x4均为二分类(1,0)。

b7b9e90fa4d1126baef1091a0fa52b3a.png
8c24fb3a564cfdd331e83585f179a08e.png
257776ede8449ad9be0315aab67989c9.png

结果X1-X4均有统计学意义,可建模分析。

*如果您的数据没差异,可选择一种回归方式筛选变量,之后在进行建模。

ad01b5dc779734ff13cc8ed139896a88.png
3d6c24c77f19b8b73f70e30c34aad11f.png

结果知:mcnemar检验P>0.05,说明实际的结局分布和预测的结局分布差异无统计学意义,可用于预测。

476e7e4cb3fee328649d76e5e44f66eb.png
77958b392badfa9be69a335ed7bd2387.png

结果同上,只是思路不一样而已。

d3711059fdde4bd80e712476a415b271.png
b72e5c4c25f0d95a2646bd3a9e949fce.png

结果同上:mcnemar检验P>0.05,说明实际的结局分布和预测的结局分布差异无统计学意义,可用于预测。

最终的预测模型为:

03912fcc8abb53b4c7621d2c828efb8b.png
69040d5e4ba57832a59557835b9d7c97.png

大家可能会觉得OR都<1&#xff0c;结果不太好去解释&#xff0c;那就把参照换掉。

160370b88c2442182b8fbb1b241d1303.png
5ee095a5a0d601d1fa830fbdaf4c8f0f.png
695a06b80cbadd7486c7ab37c5615121.png

好了&#xff0c;本期讲解到此结束&#xff0c;欢迎关注哦&#xff0c;我们下期再见~

— THE END —



推荐阅读
  • PHP组合工具以及开发所需的工具
    本文介绍了PHP开发中常用的组合工具和开发所需的工具。对于数据分析软件,包括Excel、hihidata、SPSS、SAS、MARLAB、Eview以及各种BI与报表工具等。同时还介绍了PHP开发所需的PHP MySQL Apache集成环境,包括推荐的AppServ等版本。 ... [详细]
  • 如何基于ggplot2构建相关系数矩阵热图以及一个友情故事
    本文介绍了如何在rstudio中安装ggplot2,并使用ggplot2构建相关系数矩阵热图。同时,通过一个友情故事,讲述了真爱难觅的故事背后的数据量化和皮尔逊相关系数的概念。故事中的小伙伴们在本科时参加各种考试,其中有些沉迷网络游戏,有些热爱体育,通过他们的故事,展示了不同兴趣和特长对学习和成绩的影响。 ... [详细]
  • Spring学习(4):Spring管理对象之间的关联关系
    本文是关于Spring学习的第四篇文章,讲述了Spring框架中管理对象之间的关联关系。文章介绍了MessageService类和MessagePrinter类的实现,并解释了它们之间的关联关系。通过学习本文,读者可以了解Spring框架中对象之间的关联关系的概念和实现方式。 ... [详细]
  • ShiftLeft:将静态防护与运行时防护结合的持续性安全防护解决方案
    ShiftLeft公司是一家致力于将应用的静态防护和运行时防护与应用开发自动化工作流相结合以提升软件开发生命周期中的安全性的公司。传统的安全防护方式存在误报率高、人工成本高、耗时长等问题,而ShiftLeft提供的持续性安全防护解决方案能够解决这些问题。通过将下一代静态代码分析与应用开发自动化工作流中涉及的安全工具相结合,ShiftLeft帮助企业实现DevSecOps的安全部分,提供高效、准确的安全能力。 ... [详细]
  • 本文介绍了如何使用n3-charts绘制以日期为x轴的数据,并提供了相应的代码示例。通过设置x轴的类型为日期,可以实现对日期数据的正确显示和处理。同时,还介绍了如何设置y轴的类型和其他相关参数。通过本文的学习,读者可以掌握使用n3-charts绘制日期数据的方法。 ... [详细]
  • PHP引用的概念和用法详解
    本文详细介绍了PHP中引用的概念和用法。引用是指不同的变量名访问同一个变量内容,类似于Unix文件系统中的hardlink。文章从引用的定义、作用、语法和注意事项等方面进行了解释和示例。同时还介绍了对未定义变量使用引用的情况,以及在函数和new运算符中使用引用的注意事项。 ... [详细]
  • 本文讨论了在使用Git进行版本控制时,如何提供类似CVS中自动增加版本号的功能。作者介绍了Git中的其他版本表示方式,如git describe命令,并提供了使用这些表示方式来确定文件更新情况的示例。此外,文章还介绍了启用$Id:$功能的方法,并讨论了一些开发者在使用Git时的需求和使用场景。 ... [详细]
  • 程序员如何选择机械键盘轴体?红轴和茶轴对比
    本文介绍了程序员如何选择机械键盘轴体,特别是红轴和茶轴的对比。同时还介绍了U盘安装Linux镜像的步骤,以及在Linux系统中安装软件的命令行操作。此外,还介绍了nodejs和npm的安装方法,以及在VSCode中安装和配置常用插件的方法。最后,还介绍了如何在GitHub上配置SSH密钥和git的基本配置。 ... [详细]
  • TPL实现Task.WhileAll扩展方法
    文章翻译整理自NikolaMalovic两篇博文:Task.WhileAllAwaitabletaskprogressreporting当Task.WhenAll遇见 ... [详细]
  • WebDAV之葫芦儿·派盘+天悦日记
    天悦日记支持webdav方式连接葫芦儿派盘。是一款清爽简约的日记记录工具,通过天悦日记app随时随地快速写日记,更有智能数据统计分析报表,多端同步多种备份,本地备份和基于Web ... [详细]
  • 应用场景当遇到数据分类,聚类,预测等场景问题,普通的SQL方法无法解决,需要借助算法这件武器,比如聚类算法,分类算法,预测算法等等,但是手动去研究一个算法比较吃力,有没有那种工具, ... [详细]
  • 文章目录前言pandas主要分为如下几个阶段:表格数据操作:增删改查实现多个表格的处理数据清洗操作:缺失值、重复值、异常值、数据标准化、数 ... [详细]
  • SQL Server 2008 到底需要使用哪些端口?
    SQLServer2008到底需要使用哪些端口?-下面就来介绍下SQLServer2008中使用的端口有哪些:  首先,最常用最常见的就是1433端口。这个是数据库引擎的端口,如果 ... [详细]
  • 屏幕设计设置默认值
    例如:PARAMETERS:P_werksTYPEmt61d-werksOBLIGATORYDEFAULTCSAS.工厂效果如下:转载于:https: ... [详细]
  • 基于词向量计算文本相似度1.测试数据:链接:https:pan.baidu.coms1fXJjcujAmAwTfsuTg2CbWA提取码:f4vx2.实验代码:imp ... [详细]
author-avatar
浪奔西安
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有