热门标签 | HotTags
当前位置:  开发笔记 > 数据库 > 正文

科学研究中的真相:失败让你成为更好的自己

在“二战”中,英国军方研制了一种在飞机上使用的防弹装甲材料。然而,这种材料比较重,为了不至于牺牲飞机的机动性和航程,只能在飞

在“二战”中,英国军方研制了一种在飞机上使用的防弹装甲材料。然而,这种材料比较重,为了不至于牺牲飞机的机动性和航程,只能在飞机的局部区域使用这一材料。这样一来,设计师就面临一个重要的问题:需要把这种材料首先用于飞机的哪个部分?

盟军决定采用数据驱动的方法。他们检查了执行任务后返回的B-29轰炸机并且标记了每一个中弹点。在收集了数据之后,决策似乎是显而易见的:把装甲材料用于弹孔最多的地方(图1)。当他们要推行这一计划时,研究小组中的统计学家亚伯拉罕·沃尔德(Abraham Wald)提出了不同的意见。他向国防部指出,正确的策略应该是反过来做:把装甲材料用于那些没有中弹的部位。这是因为所有的记录都来自成功返回基地的飞机。如果一架飞机成功往返的话,那么看上去像蜂窝乳酪的机身就并非是我们关注的重点。相反,引擎部位等没有弹孔的地方才是需要额外保护的关键部位,因为这些部位中弹的飞机根本就没有返回。

020a3270d738674d792727064e27d195.png

图1幸存者偏差

一架“二战”时期的轰炸机上假想的中弹点分布。返航飞机上的中弹点表明这些部分可以被击中而飞机仍然可以安全返航,而那些被击中其他部位的飞机却未能返航(本图片遵守CC BY-SA 4.0创作共用许可协议,取自维基百科)。

这个经典的例子表明,基于只包含成功的样本数据,所得到的初始结论可能会被完全推翻。科学中类似的偏差非常多:文献往往聚焦于那些能够获得基金、在同行评审的期刊上发表文章、获得授权专利、成立新企业以及长期多产的研究人员。聚焦这些成功的案例引发一个重要的问题:既然目前对于科学的理解几乎都是基于成功的故事而得到的,我们能否确信这些结论不需要大的修正?

科学中的失败尚未得到系统性的研究,其原因主要是人们难以精确跟踪失败的构想,个体和团队以采集真实信息。为弥补这一缺失,我们可以探索新的数据资源并与现有资源相结合。例如,2001年以来,美国专利商标局的所有专利申请都在其优先权日期18个月以内被公开,而不管这些专利是否获得授权。通过跟踪所有的专利申请,我们就可以区分出那些获得美国专利商标局专利授权的成功构想,以及那些没有获得授权的构想。基金申请数据库中包含了受到资助和未受资助的基金申请,这也构建了一种丰富的信息资源,帮助我们更好地认知科学研究中的成功与失败。当然,只有数量有限的研究人员能够访问美国国家卫生研究院和荷兰科学研究组织这样的资助机构的内部数据库。这一数据如果与现有的文献和引用数据库相结合,就能探寻成功和失败中蕴含的丰富内容。

在这一方向上的初步努力已经有了令人惊喜的发现。以我们自己的一项研究为例398。我们追踪年轻科学家提交给美国国家卫生研究院的R01申请,并关注其是否恰好处在资助的边界上,这样我们就可以比较“侥幸成功”和“不幸失败”的申请人,从而观察他们更长期的生涯表现。尽管这两组年轻科学家在提交R01申请之前有着几乎一致的科研水平,获得了非常相似的资助申请评分,但是最终一组“侥幸成功”,5年间平均得到130万美元的资助,而另一组则“功亏一篑”。这种早期学术生涯的挫折对于年轻科学家的影响有多大?

为此,我们跟踪了两组人员后续的表现,发现早期生涯的挫折确实有影响:

它显著增加了人员流失率。不幸失败的申请人永远离开美国国家卫生研究院系统的可能性要比侥幸成功的申请人高出10%以上。这一流失率是惊人的,因为要成为一名美国国家卫生研究院的首席研究员(PI),申请人需要有良好的业绩记录以及多年的训练。换句话说,一次挫折可以终止一个人的学术生涯。

然而最令人吃惊的是,数据显示从长期来看,不幸失败的个体如果继续其科研工作的话,会系统性超越侥幸成功的个体,前者在后续10年发表的文章具有明显更高的影响力。这一发现相当震惊。两个具有相似表现,都在努力发展的“双胞胎”似的研究人员,一个在早期就获得了基金资助,而另一个没有获得,但结果反而是那个没有获得资助的研究人员后续发表了具有更高影响力的文章。

一个可能的解释是筛选机制。不幸失败组中的“幸存者”具有先天的良好特质,从而使得继续留在领域内的人总体上比侥幸成功的人表现更好。但是我们发现这一机制本身并不能解释两组人员的表现差异。换句话说,那些早期没有获得基金资助但仍然坚持不懈的人并不是一开始就表现良好,而是逐步磨砺,也成了更好的自己,印证了“玉汝于成”这个成语。

这些结果看上去特别反直觉,因为科学遵从“富者更富”的规律,但结果却是失败而不是成功带来了更多的成功。这些发现表明科学中的失败具有很强的反作用——损伤了一部分人的研究生涯,却无意中促进了其中某些人的成功。如同早期的成功一样,早期的失败也可以成为未来成功的风向标。这是一个好消息,因为科学家即使不是每天,也会每周都经历失败。

这一研究也得出了一个更广泛适用的观点:尽管我们在理解成功方面取得了一些成功,我们也许在理解失败方面却遭遇了失败。由于研究人员更多的是经历失败而不是成功,了解他们失败的时间、原因、方式及其后果,不仅对于理解和改进科学至关重要,也将通过揭示创造性活动的全过程而极大增进我们对于人类想象力的理解。

科学的真相:退稿增强了文章的影响力

如果一位研究人员提交的论文一再被退稿,他可能就会觉得这篇文章并没有那么好,即使发表出来也很有可能无人问津。然而数据显示的却是另外一番景象:退稿事实上增强了文章的影响力。我们能知道这一点,要归功于一项研究。这项研究跟踪了2006—2008年发表在923种生物学期刊上的80 748篇文章的投稿历史400。研究表明二次投稿的比例是很低的:75%的文章都发表在第一次投稿的期刊上。换句话说,科学家们擅长于判断他们的文章最适合哪个期刊。但是,通过比较二次投稿后发表的文章与那些第一次投稿就发表的文章,研究人员惊讶地发现:与那些第一次投稿就被录用的文章相比,那些发表在同一期刊上,但第一次投稿被拒,第二次投稿才被录用的文章,在发表后的6年时间里会获得更高的引用。失败为何能够提升影响力呢?

一种可能性是作者擅长于估计其研究的潜在影响力。因此,那些一开始提交到高影响期刊的稿件即使被退稿,其本质上也是更“适合”被引用的。但是,这一理论不能完全解释观察到的现象:因为不管二次投稿会投向更高还是更低影响力的期刊,都得到了更高的引用量。这就说明了另一种可能性:编辑和审稿人的反馈以及为了二次投稿而额外花在修改文章上的时间,使得最终文章的质量更高,也更适合被引用。因此,如果你有一篇文章被退稿,请不要为重新投稿而沮丧——那些打败不了你的确实会让你变得更强大。

ea679f4e4be4ab5837d08479de07fc73.png

本文节选自《给科学家的科学思维》,2021年12月,湛庐文化出品

作者:王大顺/艾伯特-拉斯洛·巴拉巴西

出版时间:2021年12月

出版社:湛庐文化 / 天津科学技术出版社


推荐阅读
  • 本文介绍了在开发Android新闻App时,搭建本地服务器的步骤。通过使用XAMPP软件,可以一键式搭建起开发环境,包括Apache、MySQL、PHP、PERL。在本地服务器上新建数据库和表,并设置相应的属性。最后,给出了创建new表的SQL语句。这个教程适合初学者参考。 ... [详细]
  • 基于layUI的图片上传前预览功能的2种实现方式
    本文介绍了基于layUI的图片上传前预览功能的两种实现方式:一种是使用blob+FileReader,另一种是使用layUI自带的参数。通过选择文件后点击文件名,在页面中间弹窗内预览图片。其中,layUI自带的参数实现了图片预览功能。该功能依赖于layUI的上传模块,并使用了blob和FileReader来读取本地文件并获取图像的base64编码。点击文件名时会执行See()函数。摘要长度为169字。 ... [详细]
  • Android中高级面试必知必会,积累总结
    本文介绍了Android中高级面试的必知必会内容,并总结了相关经验。文章指出,如今的Android市场对开发人员的要求更高,需要更专业的人才。同时,文章还给出了针对Android岗位的职责和要求,并提供了简历突出的建议。 ... [详细]
  • 本文介绍了Java工具类库Hutool,该工具包封装了对文件、流、加密解密、转码、正则、线程、XML等JDK方法的封装,并提供了各种Util工具类。同时,还介绍了Hutool的组件,包括动态代理、布隆过滤、缓存、定时任务等功能。该工具包可以简化Java代码,提高开发效率。 ... [详细]
  • 本文介绍了adg架构设置在企业数据治理中的应用。随着信息技术的发展,企业IT系统的快速发展使得数据成为企业业务增长的新动力,但同时也带来了数据冗余、数据难发现、效率低下、资源消耗等问题。本文讨论了企业面临的几类尖锐问题,并提出了解决方案,包括确保库表结构与系统测试版本一致、避免数据冗余、快速定位问题等。此外,本文还探讨了adg架构在大版本升级、上云服务和微服务治理方面的应用。通过本文的介绍,读者可以了解到adg架构设置的重要性及其在企业数据治理中的应用。 ... [详细]
  • 生成对抗式网络GAN及其衍生CGAN、DCGAN、WGAN、LSGAN、BEGAN介绍
    一、GAN原理介绍学习GAN的第一篇论文当然由是IanGoodfellow于2014年发表的GenerativeAdversarialNetworks(论文下载链接arxiv:[h ... [详细]
  • [译]技术公司十年经验的职场生涯回顾
    本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同,令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望,认为人类有能力不断改善自己。 ... [详细]
  • 图解redis的持久化存储机制RDB和AOF的原理和优缺点
    本文通过图解的方式介绍了redis的持久化存储机制RDB和AOF的原理和优缺点。RDB是将redis内存中的数据保存为快照文件,恢复速度较快但不支持拉链式快照。AOF是将操作日志保存到磁盘,实时存储数据但恢复速度较慢。文章详细分析了两种机制的优缺点,帮助读者更好地理解redis的持久化存储策略。 ... [详细]
  • Java String与StringBuffer的区别及其应用场景
    本文主要介绍了Java中String和StringBuffer的区别,String是不可变的,而StringBuffer是可变的。StringBuffer在进行字符串处理时不生成新的对象,内存使用上要优于String类。因此,在需要频繁对字符串进行修改的情况下,使用StringBuffer更加适合。同时,文章还介绍了String和StringBuffer的应用场景。 ... [详细]
  • 安装mysqlclient失败解决办法
    本文介绍了在MAC系统中,使用django使用mysql数据库报错的解决办法。通过源码安装mysqlclient或将mysql_config添加到系统环境变量中,可以解决安装mysqlclient失败的问题。同时,还介绍了查看mysql安装路径和使配置文件生效的方法。 ... [详细]
  • 本文详细介绍了SQL日志收缩的方法,包括截断日志和删除不需要的旧日志记录。通过备份日志和使用DBCC SHRINKFILE命令可以实现日志的收缩。同时,还介绍了截断日志的原理和注意事项,包括不能截断事务日志的活动部分和MinLSN的确定方法。通过本文的方法,可以有效减小逻辑日志的大小,提高数据库的性能。 ... [详细]
  • 推荐一个ASP的内容管理框架(ASP Nuke)的优势和适用场景
    本文推荐了一个ASP的内容管理框架ASP Nuke,并介绍了其主要功能和特点。ASP Nuke支持文章新闻管理、投票、论坛等主要内容,并可以自定义模块。最新版本为0.8,虽然目前仍处于Alpha状态,但作者表示会继续更新完善。文章还分析了使用ASP的原因,包括ASP相对较小、易于部署和较简单等优势,适用于建立门户、网站的组织和小公司等场景。 ... [详细]
  • Mac OS 升级到11.2.2 Eclipse打不开了,报错Failed to create the Java Virtual Machine
    本文介绍了在Mac OS升级到11.2.2版本后,使用Eclipse打开时出现报错Failed to create the Java Virtual Machine的问题,并提供了解决方法。 ... [详细]
  • 本文介绍了在SpringBoot中集成thymeleaf前端模版的配置步骤,包括在application.properties配置文件中添加thymeleaf的配置信息,引入thymeleaf的jar包,以及创建PageController并添加index方法。 ... [详细]
  • 知识图谱——机器大脑中的知识库
    本文介绍了知识图谱在机器大脑中的应用,以及搜索引擎在知识图谱方面的发展。以谷歌知识图谱为例,说明了知识图谱的智能化特点。通过搜索引擎用户可以获取更加智能化的答案,如搜索关键词"Marie Curie",会得到居里夫人的详细信息以及与之相关的历史人物。知识图谱的出现引起了搜索引擎行业的变革,不仅美国的微软必应,中国的百度、搜狗等搜索引擎公司也纷纷推出了自己的知识图谱。 ... [详细]
author-avatar
手机用户2502875747
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有