热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

因果推断书籍(计量经济学)推荐

作者:连玉君链接:https:www.zhihu.comquestion508899541answer2290164360来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非

作者:连玉君
链接:https://www.zhihu.com/question/508899541/answer/2290164360
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。


2021 年因果关系方法论获得诺贝尔经济学奖啦!茫茫书海,却不知道自己该从何入手学习因果推断?今天,Brady Neal 博士给各位梳理一下如火如荼的「因果推断」主流教科书,以便帮你确定「意中人」!别人眼中的「圣经」可能是你的「天书」。此话不假,有些书之所以难懂,并不是作者写的不好,很可能是我们自己的知识背景和思维模式与作者的存在较大的差异,以至于彼此「相看两厌」。

事实上,通过读书学习某些新东西,又如选择合适的道路登山。你若经验丰富,自然应该选择严峻的「捷径」,省了时间,也多了挑战的乐趣;你若追求闲庭阔步,自然应该选择滑坡而行,虽然慢,但却可以尽览沿途美景。前者对应的书籍会采用大量简洁的数学公式,而后者则更多是图文并茂,辅以浅显易懂的小例子。当然,后者有时候会略显繁琐,但却是初学者的福音。

我们先列出今天要介绍的「八大金刚」,随后逐一评价。



  • B1-Pearl2016:Causal Inference in Statistics: A Primer (Pearl et al., 2016)

  • B2-Peters2017: Elements of Causal Inference: Foundations and learning Algorithms ( Peters et al., 2017 )

  • B3-Imbens2015: Causal Inference for Statistics, Social, and Biomedical Sciences: An Introduction ( Imbens & Rubin, 2015 )

  • B4-Rosenbaum2010:Design of Observational Studies ( Rosenbaum, 2010 )

  • B5-Hernán2020:Causal Inference: What If ( Hernán & Robins, 2020 )

  • B6-Morgan2014:Counterfactuals and Causal Inference: Methods and Principles for Social Research ( Morgan & Winship, 2014 )

  • B7-Angrist2009:Mostly Harmless Econometrics ( Angrist & Pischke, 2009 )

  • B8-Pearl2009:Causality: Models, Reasoning, and Inference ( Pearl, 2009 )

小测试:你需要修炼到哪个层次?


别着急,先做个小测试吧,看看自己最适合先从哪本书开始阅读 ( 以下测试根据博主 Neal 文章中的流程图改编 )。


Source: Which causal inference book you should read


  • Q1. 想要快速入门还是深入学习?

[ ] 快速入门 - B1-Pearl2016

[ ] 深入学习 - B2-Peters2017



  • Q2. 是否偏好机器学习/结构学习?

[ ] 是 - B2-Peters2017

[ ] 否 - Q3



  • Q3. 偏好基础理论还是应用?

[ ] 基础理论 - Q4

[ ] 应用 - Q5

[ ] 中立 - Q8



  • Q4. 是否喜欢图表?

[ ] 喜欢 - Q6

[ ] 不喜欢 - B3-Imbens2015 OR B4-Rosenbaum2010

[ ] 中立 - Q8



  • Q5. 更关注哪一方面的应用,流行病学、社会科学还是计量经济学?

[ ] 流行病学 - B5-Hernán2020

[ ] 社会科学 - B6-Morgan2014

[ ] 计量经济学 - B7-Angrist2009



  • Q6. 是否想快速入门?

[ ] 想 - B1-Pearl2016

[ ] 不想 - Q7



  • Q7. 是否熟悉 structural causal models(SCMs)并想要精通于此?

[ ] 是 - B8-Pearl2009

[ ] 否 - B2-Peters2017



  • Q8. 可以根据作者关注的视角来进行选择

[ ] 统计推断 ( statistics ) - B3-Imbens2015 OR B4-Rosenbaum2010

[ ] 机器学习 ( machine learning ) - B2-Peters2017

[ ] 因果图 ( causal graphs ) - B1-Pearl2016

[ ] 流行病学 ( epidemiology ) - B5-Hernán2020

[ ] 社会科学 ( social sciences ) - B6-Morgan2014

[ ] 计量经济学 ( econometrics ) - B7-Angrist2009

书籍详解


⭕ B1-Pearl2016: Causal Inference in Statistics: A Primer ( Pearl et al., 2016 )

这本书对于初学者来说再好不过,对因果推断和合成控制法有清晰明了的介绍,语言较为直白,少有公式或代码,可读性高。第一作者 Pearl 是 UCLA 计算科学的教授,曾获图灵奖,对因果推断做出了许多重要贡献,开创了基于有向图结果的因果推断。作者的另一本书《为什么:关于因果关系的新科学》 ( The Book of Why: The New Science of Cause and Effect ) 或许更为大家所知,感兴趣的读者可以阅读。

豆瓣用户评论“全书一共四章,前两章比较基础,介绍了所有 CI 最基本的理论部分。第三章 intervention,第四章 counterfactual 是属于比较深入的话题。这本书弥补了 book of why 里的技术细节,所有的概念也经由数学语言严格化,解决了很多 book of why 里泛泛而谈造成的细节缺失……”


⭕ B2-Peters2017: Elements of Causal Inference: Foundations and learning Algorithms ( Peters et al., 2017 )

“总结了近年来比较前沿的因果推断研究结论,大量篇幅用于证明和形式化描述定理、引理、结论等”,不太适合初学者,适合有机器学习背景的人学习,该书甚至有两章专门讨论因果推断与机器学习之间的联系。综合来说,这本书包含了其他书通常不会涉及的因果发现 ( causal discovery ) ,因而可能是学习现代因果发现 ( modern causal discovery/ structure learning ) 技术最好的书,能为后续结构因果模型 ( structural causal models ,SCMs ) 的学习打下基础。


⭕ B3-Imbens2015: Causal Inference for Statistics, Social, and Biomedical Sciences: An Introduction ( Imbens & Rubin, 2015 )

厦门大学赵西亮老师认为“这本书应该是学习因果推断的圣经”。“如果让我为大家只推荐一本因果推断的书,那么它将是由斯坦福大学教授 Imbens 和哈佛大学教授 Rubin 合著的《Causal Inference for Statistics, Social, and Biomedical Science: An Introducation》,没有之一。两位作者分别是在计量经济学和统计学领域的大牛,相信各位对两位学者都不陌生,其中 Rubin 就是潜在结果框架的提出者,潜在结果框架有时也用 Rubin 的名字命名,称为 RubinCausal Model。”

豆瓣用户 Bing 评论“全书的主要内容是 RCM ( Rubin Causality Model ) ,也就是基于 potential outcome 概念的因果模型,以 Rubin 早中期的研究成果为主,大多数内容都以随机试验为主要数据场景。每章都有大量的理论说明和推导,并配合一个(小)数据分析的实例。主要内容是因果分析的随机试验准则,倾向得分,匹配,混淆因素,工具变量等。最新的一些方法如 DID,RDD 等等,据作者所言将准备交给下册。…… 全书传统统计理论研究色彩浓厚,逻辑缜密,推导细致严谨,但可能会让社会科学等其他领域的人望而生畏。”


⭕ B4-Rosenbaum2010: Design of Observational Studies ( Rosenbaum, 2010 )

亚马逊用户评论 “我不知道为什么没有人看过这本书,也不知道为什么它不受欢迎,但如果你对从观测数据 ( observational data ) 中收集到的信息感兴趣,那这本书是很值得推荐的。观测数据和实验数据不同,相较来说,对观测数据的研究旨在寻找非随机干预措施的效果。这一研究主题在医疗科学、教育和社会科学中很重要,因为在这些研究领域,很容易获得观测数据,并能从数据中得到某些问题的答案。”


⭕ B5-Hernán2020: Causal Inference: What If ( Hernán & Robins, 2020 )

该书由哈佛大学公共卫生院的两位教授合写,主要针对医学领域,比较简单易懂,也可以作为因果推断的入门教材。作者之一 Jamie Robins 对流行病学和因果推论的发展做出了重要贡献,图灵奖得主 Pearl 认为他的调整公式在其 1986 年论文中就隐含出现了(第一次在文献中可以看出该调整公式)。博主 Neal 认为这是他所有读过的书中最实用的一本,举例来说,这本书是唯一涵盖了“ positivity / overlap ”概念的书,而这是估计因果效应必须满足的重要条件。此书也是提到的几本书中唯一涵盖了如何估计结果模型 ( outcome models ) 和倾向得分匹配模型 ( propensity score models ) 的书。应该指出,这本书中有很大的篇幅用于介绍可在实践中使用的估计量。第一部分主要介绍的是无模型的因果推断;第二部分则介绍有模型的因果推断;第三部分是如何在复杂的纵向数据中进行因果推断。


⭕ B6-Morgan2014: Counterfactuals and Causal Inference: Methods and Principles for Social Research ( Morgan & Winship, 2014 )

这同样是一本非常实用的书,这本书篇幅较长,作者引用了社会科学中的许多实际例子,可以说是涵盖了经济学,计算机科学以及整个社会科学中因果推断文献的主题。作为一个喜欢抽象而不是举例的人,博主 Neal 认为此书部分章节稍显冗长,但能为我们提供丰富的参考文献,并提供这些论文的最关键细节。从内容上来看,这本书很好地结合了潜在结果 ( potential outcomes ) 和图形因果推断 ( graphical causal models ) 的观点,并进行了比较。此外,该书涵盖了基于条件的因果效应估计量 ( conditioning-based estimators of causal effect ) 的 3 种不同类别,并分别用相应章节进行讲解:匹配,回归和逆概率加权。其他章节则涉及了工具变量和前门调节变量等。


⭕ B7-Angrist2009: Mostly Harmless Econometrics ( Angrist & Pischke, 2009 )

不必多言,这本书想必学经济的各位都很熟悉了。如果你想了解经济学家是如何看待因果推断的,那这本书非常适合你。针对一系列问题:“较小的班级规模是否会提高学生的学习成绩?最低工资会减少就业吗?虐待妻子的人应该被逮捕吗?教育能提高多少收入?民主会促进经济增长吗?”,这本书展示了如何应用计量经济学方法回答这些因果问题。

总体来说,此书不太关注基于条件的估计量 ( 想想 backdoor adjustment ) 。相反,它着墨于准自然实验方法,比如说工具变量方法、双重差分方法、断点回归设计等等。由于没有特别复杂的数理推导过程,此书对数学不那么好的同学非常友好,中文翻译版有些地方可能不太容易理解,有条件的友友可以对照英文原版阅读哦。

由于这本书是 2009 年出版的,因此未涵盖诸如合成控制法之类的最新方法。想要阅读一本涵盖合成控制法的最新教科书,博主 Neal 推荐 Scott Cunningham 的“Causal Inference: The Mixtape”

安神还有一本《精通计量:从原因到结果的探寻之旅》 ( Mastering Metrics: The Path from Cause to Effect ) ,更适合初学者,两者搭配食用更佳哦!喜欢《功夫熊猫》的同学更不要错过哦!此外,还推荐厦门大学赵西亮老师撰写的《基本有用的计量经济学》。


⭕ B8-Pearl2009: Causality: Models, Reasoning, and Inference ( Pearl, 2009 )

对想成为 structural causal models ( SCM ) 专家的人,强烈推荐此书!书中有丰富的理论知识,不是很容易阅读。如果你没有学习过或没有强烈的动机去了解 SCM ,那此书几乎是不可读的。博主 Neal 认为网络上对于这本书的评价过于刻薄,应该指出,这些苛刻的评论多来自对该理论不太感兴趣的人。在阅读了一些比较入门的书籍并对因果关系有了一定了解之后,再来阅读此书,想必会有更为深刻的理解。若已经提前读过这本书,日后重读一遍也是非常有意义的。


⭕ 其他书籍推荐 博主 Neal 在原博文里还推荐了几本流程图里未涉及到的书籍:


  • Explanation in Causal Inference: Methods for Mediation and Interaction ( VanderWeele, 2015 ) 适合想要成为中介分析 ( mediation ) 和调节分析 ( interaction ) 领域专家的读者阅读。由于此书目标读者为普罗大众,所以正文部分不是很具有技术性。然而本书的附录几乎包含了读者所有想知道的技术细节,甚至能作为一本单独的书来阅读。此外,本书获得了美国统计协会 2015 年颁布的“ Causality in Statistics Education ”奖项。

  • Observation and Experiment: An Introduction to Causal Inference ( Rosenbaum, 2017 ) Rosenbaum 除了撰写前文提及的 Design of Observational Studies ( Rosenbaum, 2010 ) 一书,还于 2017 年出版了另一本有关因果推断的书。从博主 Neal 所阅读过的部分来看,这本 2017 年出版的书将比 2010 年的书更易读。下面是 Rosenbaum 对他自己这本书的评价“我在此书中的目标是以更少的技术细节呈现因果推断的相关概念,力求精准和清晰”。

  • Causation, Prediction, and Search ( Spirtes et al., 2001 ) 本书的前两位作者提出了经典的 PC ( Peter and Clark ) 算法。Pearl 认为这本书的第一版 ( 1993 ) 引入了这样一个概念,即 “ an intervention corresponds to removing all incoming edges to the intervened node in the graph ”。同时,Pearl 还认为这本书的第一次出版明确了调整公式 ( 与罗宾斯 1986 年论文中的相反 )。

  • Actual Causality ( Halpern, 2016 ) Joseph Halpern 为了厘清 X 对 Y 的影响到底意味着什么,做了大量工作,这使得这本书成为理解某事物为何是其他事物的原因的重要书籍之一。

  • Targeted Learning ( van der Laan & Rose, 2011 )

详细内容参见连享会推文



  • 专题:计量专题


    • 因果推断:哪本教材适合我?



相关推文


Note:产生如下推文列表的 Stata 命令为:
. lianxh 书
. songbl 书
安装最新版 lianxh/ songbl 命令:
. ssc install lianxh, replace
. ssc install songbl, replace



    • 专题:专题课程


      • 助教入选通知-国家级项目申报书专题







  • 专题:计量专题


    • 因果推断新书在线读:Causal Inference-The Mixtape

    • UCLA-主流计量教科书Stata实操





    • 专题:Stata资源


      • 哇!Stata参考书和经典教材!







  • 专题:内生性-因果推断


    • 因果推断好书:Causal-Inference-Measuring-the-Effect-of-X-on-y

    • Stata因果推断新书:The-SAGE-Handbook-of-Regression-Analysis-and-Causal-Inference





    • 专题:Python-R-Matlab


      • Python+Stata:批量制作个性化结业证书







  • 专题:Markdown-LaTeX


    • Markdown中书写LaTeX数学公式简介





    • 专题:工具软件


      • 可汗学院风格电子板书攻略:Wacom+ArtRage

      • Sai2: 一款流畅的电子板书软件

      • 直播电子板书:Word, PPT, PDF 手写批注很轻松







  • 专题:其它


    • 知乎高赞:17个高质量网站-让你拥有几乎所有的书籍




推荐阅读
  • 微软头条实习生分享深度学习自学指南
    本文介绍了一位微软头条实习生自学深度学习的经验分享,包括学习资源推荐、重要基础知识的学习要点等。作者强调了学好Python和数学基础的重要性,并提供了一些建议。 ... [详细]
  • 本文介绍了贝叶斯垃圾邮件分类的机器学习代码,代码来源于https://www.cnblogs.com/huangyc/p/10327209.html,并对代码进行了简介。朴素贝叶斯分类器训练函数包括求p(Ci)和基于词汇表的p(w|Ci)。 ... [详细]
  • Iamtryingtomakeaclassthatwillreadatextfileofnamesintoanarray,thenreturnthatarra ... [详细]
  • 本文介绍了brain的意思、读音、翻译、用法、发音、词组、同反义词等内容,以及脑新东方在线英语词典的相关信息。还包括了brain的词汇搭配、形容词和名词的用法,以及与brain相关的短语和词组。此外,还介绍了与brain相关的医学术语和智囊团等相关内容。 ... [详细]
  • 云原生边缘计算之KubeEdge简介及功能特点
    本文介绍了云原生边缘计算中的KubeEdge系统,该系统是一个开源系统,用于将容器化应用程序编排功能扩展到Edge的主机。它基于Kubernetes构建,并为网络应用程序提供基础架构支持。同时,KubeEdge具有离线模式、基于Kubernetes的节点、群集、应用程序和设备管理、资源优化等特点。此外,KubeEdge还支持跨平台工作,在私有、公共和混合云中都可以运行。同时,KubeEdge还提供数据管理和数据分析管道引擎的支持。最后,本文还介绍了KubeEdge系统生成证书的方法。 ... [详细]
  • CF:3D City Model(小思维)问题解析和代码实现
    本文通过解析CF:3D City Model问题,介绍了问题的背景和要求,并给出了相应的代码实现。该问题涉及到在一个矩形的网格上建造城市的情景,每个网格单元可以作为建筑的基础,建筑由多个立方体叠加而成。文章详细讲解了问题的解决思路,并给出了相应的代码实现供读者参考。 ... [详细]
  • 本文介绍了Codeforces Round #321 (Div. 2)比赛中的问题Kefa and Dishes,通过状压和spfa算法解决了这个问题。给定一个有向图,求在不超过m步的情况下,能获得的最大权值和。点不能重复走。文章详细介绍了问题的题意、解题思路和代码实现。 ... [详细]
  • 本文介绍了在go语言中利用(*interface{})(nil)传递参数类型的原理及应用。通过分析Martini框架中的injector类型的声明,解释了values映射表的作用以及parent Injector的含义。同时,讨论了该技术在实际开发中的应用场景。 ... [详细]
  • Python中的PyInputPlus模块原文:https ... [详细]
  • 本文主要解析了Open judge C16H问题中涉及到的Magical Balls的快速幂和逆元算法,并给出了问题的解析和解决方法。详细介绍了问题的背景和规则,并给出了相应的算法解析和实现步骤。通过本文的解析,读者可以更好地理解和解决Open judge C16H问题中的Magical Balls部分。 ... [详细]
  • 本文讨论了使用差分约束系统求解House Man跳跃问题的思路与方法。给定一组不同高度,要求从最低点跳跃到最高点,每次跳跃的距离不超过D,并且不能改变给定的顺序。通过建立差分约束系统,将问题转化为图的建立和查询距离的问题。文章详细介绍了建立约束条件的方法,并使用SPFA算法判环并输出结果。同时还讨论了建边方向和跳跃顺序的关系。 ... [详细]
  • [译]技术公司十年经验的职场生涯回顾
    本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同,令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望,认为人类有能力不断改善自己。 ... [详细]
  • ZSI.generate.Wsdl2PythonError: unsupported local simpleType restriction ... [详细]
  • 本文讨论了clone的fork与pthread_create创建线程的不同之处。进程是一个指令执行流及其执行环境,其执行环境是一个系统资源的集合。在调用系统调用fork创建一个进程时,子进程只是完全复制父进程的资源,这样得到的子进程独立于父进程,具有良好的并发性。但是二者之间的通讯需要通过专门的通讯机制,另外通过fork创建子进程系统开销很大。因此,在某些情况下,使用clone或pthread_create创建线程可能更加高效。 ... [详细]
  • 本文介绍了一种轻巧方便的工具——集算器,通过使用集算器可以将文本日志变成结构化数据,然后可以使用SQL式查询。集算器利用集算语言的优点,将日志内容结构化为数据表结构,SPL支持直接对结构化的文件进行SQL查询,不再需要安装配置第三方数据库软件。本文还详细介绍了具体的实施过程。 ... [详细]
author-avatar
Mister-Sky_724
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有