科研不是比赛,而是一种对未知和完美的自我追求——跟邢波(EricXing)面对面聊科研
作者:Lululingling2002_886 | 来源:互联网 | 2023-05-19 05:32
编者按:6月26日,2014年国际机器学习大会(ICML)在北京国际会议中心完美落幕。作为机器学习领域两大顶尖年会之一,这是ICML大会30多年来首次来到中国和远东,在国内的机器学习界震动不小。身为
编者按:6月26日,2014年国际机器学习大会(ICML)在北京国际会议中心完美落幕。作为机器学习领域两大顶尖年会之一,这是 ICML大会30多年来首次来到中国和远东,在国内的机器学习界震动不小。身为本次大会主席的卡耐基梅隆大学计算机系教授邢波(Eric Xing)为此做了诸多努力。作为在美国机器学习领域前沿为数不多的华人学者,许多国内计算机专业学生渴望投身其门下。借着此次大会的举办,我们也有幸和Eric坐下来,面对面的聊一聊他对科研的态度以及对后辈们的建议。
问:从生物学博士到计算机科学博士,再到机器学习领域的佼佼者,这样的转变是如何发生的?
为什么会选择进入一个新的专业?因为兴趣。当时对手头做的研究项目兴趣不够,而同时又有其他的东西让自己很着迷,所以在完成前项工作后就选择了转变。现在回头看,这样的转变在我的生活中并不少见,比如,我最近开始在做计算机系统相关的研究。操作系统跟机器学习是很不一样的领域,这种转变的距离和我之前的转变一样远,但兴趣使然。15年前,人工智能和机器学习在美国学术圈很冷门,中国人不多、美国人也不多,当时基于兴趣选择转专业,现在也一样。当选择改变时,不要把它当个大事,要把生理和心理障碍压到最低。”
问:不少人认为,做科研极为枯燥。你认为这里面有误解吗?
Eric:“确实有人觉得科研枯燥、与产品的结合不够紧密,像是对未来的虚幻想象。这其中有一些误解。很多人基于片面的理解或有限的经验,简单的把理论研究和应用研究对立起来,并由此产生一种肤浅的排他思想;比如有些“基础研究”学者瞧不起“应用研究”学者,认为后者不严格正统,或者有些业界的工程师程序员也鄙视大学里的研究者,认为后者不实用。抱有这种想法的人很难成为领先的学者和工程师。其实计算机科研是最不枯燥的研究,优秀的计算机研究往往体现着理论和现实问题的紧密结合。它不是纯粹推导公式、设计模型,证明定理;也不是埋头编程,调参,试错。严谨的计算机科研需要跟数学打交道,这可能对于某些人来说,有些枯燥;但对于另一些人来说,这仍然很有趣并令人兴奋。事实上,谷歌的搜索引擎、微软的Kinect等都是由基础研究衍生出来的产品——当你把研究跟实际应用结合起来,兴趣是很容易产生的。或许研究过程中会比较理论,但我们是基于现实应用问题来提出研究问题。当你希望用一个漂亮的方法(正规、严密,普适,可独立重复的方法)解决问题时,你自然会使用数学手段;但是最后的实现、评估、证明等是从理论和实际应用两个方面来出发,这样就会很有意思。
问:有传闻说您每天只睡4-5个小时,做科研这么忙吗?
Eric:“我不是为了忙而忙,而是顺其自然。就好像弹琴有的地方弹得快了后,慢了自己都不好意思,快反而是一种自然的节奏。有时候会更慢一些、有时候会更快一些,也没有刻意去保持。当然,其实从生活质量来说,也没有那么可怕。我也有进行规律的健身锻炼,业余爱好,跟家人一起玩,等等,我不提倡把自己弄得很憔悴、不顾家庭或不跟朋友交往。如何做到呢?不要浪费时间。睡几个小时是个人生理特征,但是在不睡觉的时间里,要怎么用?大部分人在大部分时间处于什么都没做的状态,他们既没有做公事,也没有做私事,但我基本上不存在这样的时间,我要不就做一些跟工作有关的事,要不就抽空锻炼、弹琴,听音乐,看书,,或跟家人一起活动。虽然没有一个明显的工作到生活的某个切换点,但找准了工作和生活的节奏,还是很自然。对于我来说,研究、健身等事情不是要‘坚持’才能做到的事儿,而是我迫不及待要去做,这些都不是很难受的事儿。”
问:国内不少学生都想当您的学生,那您是如何挑选学生的呢?
Eric:“首先我要通过你向同学们对我们工作的兴趣表示感谢!我很希望能满足同学们的愿望。有时候,这不仅仅是学生的问题,也是我自己的精力和资金的问题。在美国,招学生是一个相当昂贵的事情,每人每年要资助近十万美元。我的组现在有将近20个学生,再大的话,钱也不够,我的精力也不够。我带学生还是比较认真的,比如每星期至少有一次讨论,20个学生就有20次,一星期排下来也差不多了。在挑选学生的时候,我比较注重文化,风格,兴趣的多样性和平衡,而非单纯的高产,不会偏重某个国家人特别多,也力求性别的平衡。
除了这些原因,还需要一些研究兴趣的匹配,以及研究之外的东西。我招学生的时候,可能会注重一个人的个人修养或人品——就是他/她作为一个普通人的价值,而不仅仅是作为研究者所拥有的能力。研究方面的能力是可以培养的,无论是跟着我还是其他老师,学生的能力都一定会有提高。研究的起点不见得非要高,但是对学生的个人性格或修养有要求,我个人比较喜欢学生在我的组里产生正能量。更细致地话,我比较看重这四点:
一、有独立精神以及独立思考的能力。不是说我师兄师姐在做什么选题、最近最热是什么选题,我都去问问然后听从。敢于卓尔不群,坚持自己的观点;但同时也谦虚理性,而非顽固不化。
二、要有一些理想主义。不是做每一件事都有一个精准的投资回报率,要有一些纯粹为了兴趣和爱好而努力、为了尽善尽美而下功夫的追求。享受过程,而不是苛求结果,把结果当成过程的副产品,有了很好、没有也不沮丧,这样才能真正享受过程。
三、诚实而豁达。有一种简单、率真的性格,不能工于心计。
四、知书达理,有良好教养,礼貌,易于也乐于和别人共事。
我相信拥有以上四点的同学可以成为我组里很好的团队成员。
问:每次您来微软亚洲研究院做讲座,总是座无虚席,人特多。您和微软亚洲研究院有什么渊源?
Eric:“微软研究院一直以来都和CMU(卡耐基梅隆大学)有众多的交流与合作。对于我个人而言,微软亚洲研究院至今都是国内为数不多的顶级计算机研究机构,培养的学生大都非常优秀。加上我在这里有很多的朋友,他们也经常邀请我过来和同事学生们交流交流,我也都十分乐意,也学到很多东西。
问:最近在线教育(MOOC)比较火,不知道您有没有打算在网上开机器学习相关课程?
Eric:“现在MOOC很火,也颇具争议。从普及知识的角度,Coursera做了一件大好事。但作为想对某个领域有深度了解的同学来说,也必须对自己有一个清楚的定位。如果你的终极目标是对某个话题有一定了解,通过MOOC来学习是个还不错的选择。但如果你要以学习的某个方向为职业的话,就需要更多考量。现在的年轻人比较容易从众,可能会出现的一种情况是,从极度自卑到极度膨胀的距离可能会变得非常短。我个人认为,MOOC更重要的一个作用是普及教育,是扫盲用的。
然而作为一个博士研究生,你是需要普及知识,还是更高级的知识?我现在还没有加入在线教育,未来可能会,具体视CMU的政策而定。MOOC在普及知识的方面已经做得非常好了,但不见得是我最需要做的事情了。我尝试提供一些更高端、更适合专业研究需要,听众少一点、技术含量更高一点的课,所以我最近把概率图模型这门课录像、并通过CMU放到网上。Daphne Koller教授也开过这门课,在MOOC上有,但我的课教得比较前沿、更难,内容更多些,进度也可能也快些,提供给已经有扎实基础,需要深入研究机器学习的学生。今后我还会公开一门高级机器学习课。“
问:机器学习、人工智能,现在火得不行。您觉得是因为它到时候该火起来了,还是炒作的成分居多?
Eric:“二者兼有吧。现在的确是到了机器学习的时代——计算机应用的需求超过了原来普通的编程、普通的数据库所能提供的解决方案。数据很大,人肯定处理不过来,数据库不懂得提供一个足够智能的处理服务。机器学习虽然也没能提供解决方法,但它提供了一个大的思路、有意思的思路。有些人可能对机器学习存在一些比较庸俗的想法见解。比如说停留在‘机器学习到底是不是经典意义的人工智能的问题上,贬低一些现在在机器学习、深度学习领域的工作,认为这些不是真正的人工智能,哲学或物理意义上不深刻。还有一种观点认定机器学习,甚至只是深度学习已经可以解决一切的问题,只不过是缺乏一步一步去实现。这两种观点都不够成熟客观。我们需要更冷静一些,平台是对的、大方向是对的,但是还是有很多空白需要去填补、很多突破还没有实现。不要急着去摘一些果子,或者闪开就算过了,其实可以扎进去做一些有深度、有分量的东西。”
问:作为华人,在美国做科研,会有民族的包袱吗?
Eric:“我个人在文化上是非常东西兼容的,对东西方文化都有认真学习和较广泛的了解和心得。在文化层面,我可能较很多国内朋友更接近中国传统知识份子——对中国传统文化非常了解和欣赏,爱古文,诗词,历史;欣赏秦汉,魏晋之风。但说到学术研究,我不希望它被包装成民族之间的比赛。做科研,不能做成比赛,而是一种对未知和完美的自我追求。当成比赛本质上是功利性的,是做不出来一流成果的,更需要对问题有一种本质性的好奇,希望去理解、解决这个问题。比别人快、击败别人只是副产品。我老跟我的学生说一个例子,写论文与做研究就像花样滑冰、体操比赛一样,如果老想着我的动作能得10分、满分、对手怎么样,你的动作肯定走形、做不好。如果你想着——我要在舞台上享受表演,你肯定会做得很好。”
问:在您的研究领域中,数学重要吗?扮演着怎样的角色?
Eric:“重要!数学从方法论上提供解决方法,从思维上来讲它可以培养一种严谨的态度,从而为问题寻找一个比较严格的、普适的、甚至更好的解决方法。但是我不太建议单独强调数学或物理某一个学科知识的作用。就像在战场上,我身边有武器,什么合适我就抓起来用,而不是说我一定要从始到终用某一种武器。在研究的时候,我需要寻求一个经得起考验的解决方案,它是从数学来、从工程来、从物理来都不重要。只是,当你在寻求解决方案时,你会发现数学是一个避不开的因素,它自然而然地影响你的选择。
问:最后,能否给有志于从事计算机科学研究的学生提些您的个人建议?
Eric:其实之前了分享过很多次了,但都是以英文的方式。今天借着这个机会,希望也能让更多的中国学生们看到:
一、清楚地认识到什么是你的目标以及什么是你在技术能力和心智上的优势和不足,这两点对于你的成功同等重要。根据这些分析,再来设定自己的目标,规划自己的行动。
二、当你发觉有必要做出改变时不要犹豫。改变自己的职业方向永远不嫌太晚,只要这个改变是严肃的,且你能够保证在新的方向上全力以赴。那些浪费在犹豫、等待上的时间经常会比你去适应新生活的时间更长。我曾经处于自己新职业方向的谷底,因为在我更换专业的时候,我对机器学习(machine learning)一无所知。但我知道,我会爱上它,因为这个领域的美与力量。从机器学习方向的入门者到成为CMU的教授,我花了五年时间。
三、你需要非常努力地工作。在我的研究生和之后的职业生涯中,一周7天,我每天平均工作12小时,并保持着高度集中的注意力和高效率。(当然,我其实并不把我做的这些看做工作,我觉得它们和娱乐活动同样甚至更为有趣。)
四、你努力工作的动力不应该来自你的上司给予的压力,而是因为你受到工作的启发与触动,并爱上了工作。我经常告诉我的学生和朋友,我的研究就是我的生活,而不是仅仅把它看做工作。相比于看电视和玩纸牌,我更享受从事研究。
五、与此同时,你仍然可以拥有一个多彩的、充满活力的生活。我是体育迷和音乐迷,也喜欢做其他许多事情,享受和家人、朋友在一起的时光。所以我从不消磨时间。当我不在工作时,我尽情地娱乐或锻炼身体(比如去健身房,弹钢琴……),并花时间和家人、朋友们相处。
六、你需要让自己变得非常有创造力,非常独立。实话说,我研究生阶段的很多研究点子并不来自于我的导师,而是我自己想出来的。我从Berkeley的导师那里获得的,更多的是研究上的精神和资金支持、研究方式和研究品味上的启发、诚实的品质和自豪感,以及他们的友谊。
七、要了解你研究领域中最新的进展。每年读一千篇论文并不是一件耸人听闻的事。事实上如果想成为领域内的顶尖学者,你要了解一切,不仅在本领域,还有许多的相关领域。
八、当你做出突破性成果的同时,你也应该尊重领域内权威们的成果。不要认为他们愚蠢而自己更聪明,并且要去问自己为什么多年以前他们没有像你这样做。另一方面,当你确信你确实获得了权威们没有的洞见时,你也要有超越他们的勇气。
九、要变得学识广博而灵活。许多问题和技术都是相关的,不要在一棵树上吊死。
十、在研究中做一个完美主义者或理想主义者从来不是一件坏事。拥有一个乐观的性格和强健的体魄是非常重要的。不要愚蠢地假设自己因为比别人更聪明,所以能不那么努力。事实上,大多数我认识的顶尖科学家都是既绝顶聪明,又会长时间工作并保持高效。所以你需要健康的身体来与他们竞争。我自己在大学时代就是一个半专业的运动员。比起那些比我年轻10-20岁以上的学生们,我至今仍能更高强度、更长时间地连续工作和娱乐。
十一、学会沟通的艺术。乐意去与同事和竞争者讨论、分享你的观点。不仅向同事学习,也要向竞争者学习。
十二、最重要的是,请保持诚实、开放、耐心、快乐和富于远见,而不是变得卑鄙、封闭、急躁、苦涩和短视。
人物简介
邢波(Eric Xing)博士现任卡耐基梅隆大学计算机科学系教授。他的主要研究兴趣集中在机器学习和统计方法论的发展及大规模计算系统和架构,希望能够解决在复杂系统中的高维、多峰和动态的潜在世界中的自动化学习、推理以及决策问题。邢波教授拥有美国罗格斯大学分子生物学博士学位和美国加州大学伯克利分校计算机科学博士学位。
邢波教授目前正在进行的研究工作包括:1. 统计学习基础,包括针对估测时间或空间变化系数模型的理论和算法,稀疏的结构化输入/输出模型和非参数贝叶斯模型的理论和算法;2.在分布式系统或云端,搭建基于大模型和大数据规模的并行机器学习的框架;3. 针对基因调节、遗传变异和疾病相关性的计算和统计分析;4. 将统计学习应用到社交网络,数据挖掘和计算机视觉中。
邢波教授至今已发表了超过200篇受同行审议的论文。他是美国统计协会杂志(JASA)、应用统计年鉴(AOAS)、IEEE模式分析与机器智能学报(PAMI)和PLoS计算生物学杂志(the PLoS Journal of Computational Biology)的副主编,机器学习杂志(MLJ)和机器学习研究杂志(JMLR)的执行主编。他是美国国防部高级研究计划局(DARPA)信息科学与技术顾问组的成员,美国国家科学基金会(NSF)事业奖、Alfred P. Sloan学者奖、美国空军青年学者奖、 以及IBM开放协作研究学者奖获得者。
推荐阅读
-
深度学习与神经网络——邱锡鹏-一、绪论人工智能的一个子领域神经网络:一种以(人工))神经元为基本单元的模型深度学习:一类机器学习问题,主要解决贡献度分配问题知识结构:路线图:顶 ...
[详细]
蜡笔小新 2023-10-16 05:57:42
-
之前发过很多数据分析的文章,收到不少好评,但也有一些困惑:入门数据分析该学哪些知识点?该看哪些书?是从Pyth ...
[详细]
蜡笔小新 2023-10-16 12:27:43
-
-
生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ...
[详细]
蜡笔小新 2023-12-14 17:51:18
-
近日,OpenAI发布了最新的NLP模型GPT-3,该模型在GitHub趋势榜上名列前茅。GPT-3使用的数据集容量达到45TB,参数个数高达1750亿,训练好的模型需要700G的硬盘空间来存储。一位开发者根据GPT-3模型上线了一个名为debuid的网站,用户只需用英语描述需求,前端代码就能自动生成。这个神奇的功能让许多程序员感到惊讶。去年,OpenAI在与世界冠军OG战队的表演赛中展示了他们的强化学习模型,在限定条件下以2:0完胜人类冠军。 ...
[详细]
蜡笔小新 2023-12-11 11:04:43
-
背景应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ...
[详细]
蜡笔小新 2023-12-11 01:30:52
-
最近Google的Deepmind开始研究如何让AI做数学题。这个问题的提出非常有启发,逻辑推理,发现新知识的能力应该是强人工智能出现自我意识之前最需要发展的能力。深度学习目前可以 ...
[详细]
蜡笔小新 2023-10-17 10:01:37
-
数据挖掘作为近年来新兴的一门计算机边缘学科,其在国内外引起了越来越多的关注。并且随着数据挖掘技术的不断改进和数据挖掘工具的不断完善,数据挖掘必将在各行各业中得到广泛的应用。 ...
[详细]
蜡笔小新 2023-10-15 21:37:37
-
全文共3744字,预计学习时长7分钟本文将介绍21个你可能没使用过的机器学习开源工具。每个开源工具都为数据科学家处理数据库提供了不同角度。本文将重点介绍五种机器学习的 ...
[详细]
蜡笔小新 2023-10-15 15:52:17
-
本文讨论了同事工资打听的话题,包括同工不同酬现象、打探工资的途径、为什么打听别人的工资、职业的本质、商业价值与工资的关系,以及如何面对同事工资比自己高的情况和凸显自己的商业价值。故事中的阿巧发现同事的工资比自己高后感到不满,通过与老公、闺蜜交流和搜索相关关键词来寻求解决办法。 ...
[详细]
蜡笔小新 2023-12-14 16:22:57
-
本文介绍了adg架构设置在企业数据治理中的应用。随着信息技术的发展,企业IT系统的快速发展使得数据成为企业业务增长的新动力,但同时也带来了数据冗余、数据难发现、效率低下、资源消耗等问题。本文讨论了企业面临的几类尖锐问题,并提出了解决方案,包括确保库表结构与系统测试版本一致、避免数据冗余、快速定位问题等。此外,本文还探讨了adg架构在大版本升级、上云服务和微服务治理方面的应用。通过本文的介绍,读者可以了解到adg架构设置的重要性及其在企业数据治理中的应用。 ...
[详细]
蜡笔小新 2023-12-14 13:05:22
-
本文介绍了一种基于模型的深度强化学习方法,通过结合神经渲染器,教机器像人类画家一样进行绘画。该方法能够生成笔画的坐标点、半径、透明度、颜色值等,以生成类似于给定目标图像的绘画。文章还讨论了该方法面临的挑战,包括绘制纹理丰富的图像等。通过对比实验的结果,作者证明了基于模型的深度强化学习方法相对于基于模型的DDPG和模型无关的DDPG方法的优势。该研究对于深度强化学习在绘画领域的应用具有重要意义。 ...
[详细]
蜡笔小新 2023-12-11 10:27:44
-
SpringBoot整合SpringSecurity+JWT实现单点登录,Go语言社区,Golang程序员人脉社 ...
[详细]
蜡笔小新 2023-12-11 08:21:41
-
本文目录一览:1、什么是Java?2、java ...
[详细]
蜡笔小新 2023-12-09 09:28:18
-
转自:新智元三年半研发开支近70亿,累计亏损242亿。AI这门生意好像越来越不好做了。近日,商汤科技已向港交所递交IPO申请。招股书显示& ...
[详细]
蜡笔小新 2023-10-17 16:41:52
-
Lululingling2002_886
这个家伙很懒,什么也没留下!