热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

TensorFlow会成为Google在AI时代的新「安卓系统」吗?

文|周小丹在谷歌位于硅谷的园区里,一座被命名为1965的低矮的办公楼坐落在离101高速路出口最近的区域。单从地图上看,想驱车前往这座不起眼的建筑并不方便。过去几十年里,每天穿梭在这

文 | 周小丹

在谷歌位于硅谷的园区里,一座被命名为 1965 的低矮的办公楼坐落在离 101 高速路出口最近的区域。单从地图上看,想驱车前往这座不起眼的建筑并不方便。过去几十年里,每天穿梭在这条高速上的山景城居民早已经对硅谷发生的那些「改变世界」的公司和产品故事习以为常,这座矮楼当然也常常被习惯性的忽略。

但这里是谷歌大脑的所在地。现在,当人们对未来充满恐惧、谈论起人工智能是否会取代人类、机器和人的关系该是如何时,至少该先看看发生在这里的近况——作为当下一轮机器学习和神经网络热潮的第一批拥趸,谷歌大脑已经取得了一些标志性的成就。

谷歌正在围绕着 AI 重建公司,机器学习现在则成为了这家巨头包括广告、无人驾驶等重要项目的主要技术驱动力。而无论从谷歌一贯打造开放平台的「传统」来说,还是从商业化上的考量,将机器学习的成果开放给更多开发者,几乎和用这些成果改造自家产品是同样重要的问题——这一步决定了谷歌能不能在这个近乎处于蛮荒状态的 AI 时代尽早建立生态。从一定程度上来说,2015 年谷歌发布的机器学习开发平台 TensorFlow 担负了这样的使命。

2015 年,在将 TensorFlow 正式开源时,Google CEO Sundar Pichai 曾经在公开 blog 里写到:「我们内部已经看到这个工具能够提供非常强的能力,并且希望把机器学习的能力开放给更多的企业和个人开发者。」两年后,TensorFlow 已经成为 GitHub 上最受开发者欢迎的工具。远超由微软、Facebook 等公司提供的计算框架。

谷歌大脑的工程师们很愿意把 TensorFlow 的故事与安卓的诞生和意义做类比,并且津津乐道。后者是帮助 Google 完成桌面时代向移动时代转型的关键一跃。

TensorFlow 能输出谷歌的 AI 服务,并且帮助谷歌再完成一次「生态建立」的使命么?

这对正走向 AI first 的 Google,将是一个关键问题。

抢占高地

TensorFlow 的诞生和开源的过程,既符合 Google 一贯坚持开源、消除信息死角的传统和使命,又代表着这家公司在下一个十年的野心。

2011 年,四位 Google Fellow 之一、MapReduce 和 BigTable 的发明者 Jeff Dean 和当时的斯坦福计算机科学家吴恩达共同创办了 Google Brain,专注于用神经网络的方法研究人工智能。一年之后,这个最初建立在 Google X 中的项目脱颖而出,成为更高一个层级的研究机构。

《TensorFlow会成为Google在AI时代的新「安卓系统」吗?》
《TensorFlow会成为Google在AI时代的新「安卓系统」吗?》

(Google Brain的领军人物Jeff Dean,他曾经发明 MapReduce 和 BigTable)

在 Google Brain,每一个工程师都能对这个部门的使命脱口而出:让机器更智能,以提升人类生活质量。利用深度学习技术,计算机将一定程度上模拟人类大脑神经元的工作模式,建立学习机制。这也意味着这项技术发展到一定程度上,人们不再需要依据规则的系统进行人工智能在各个领域的开发,机器也不再需要提取语音、文字、图像等各个领域的特征,它可以自己通过训练达到目标。

而就是在基于神经网络的深度学习开发过程中,研发团队开发了一个名为 DistBelief 的深度学习技术框架,这个名称是「disbelieve”的谐音,代表着这是一个在技术和潜力上都「简直不可思议」的计算框架。但当时的 DistBelief 要在 16000 台计算机的计算基础上才能运行,过程非常复杂。Google Brain 团队对这个框架进行了简化,让它变得非常灵活,能够轻松运行在个人计算机或者单个或多个 CPU 和 GPU,甚至移动设备上——这成为了如今我们所熟知的 TensorFlow。

在 2015 年,Google 正式开源了 TensorFlow。这是擅长从事长期研究的 Google Brain 成立几年以来,唯一一个对外发布的产品。事实上,最初发布的版本也并不完美。但 Google 的工程师们显然有着更长远的考虑。

一方面,Google Brain 团队在最近几年已经强烈意识到,有时产品落地比发表更多的论文更加重要。更何况,Google 曾经也经历过「为他人做嫁衣」的教训。2003 年,Google 公布了关于 GFS、MapReduce 和 BigTable 三篇技术论文,它们成为云计算发展的「三驾马车」,Google 内部曾经为此欢欣鼓舞。但几年后,MapReduce 则由 Apache 基金会率先开发成分布式系统的基础构架 Hadoop,并开给外界使用并且获得广泛应用,自那以后,在开发者的认知中,Hadoop 竟然成为了 MapReduce 的「发明者」。

此事曾让 Google 的工程师们十分受挫。所以这一次,Google Brain 不再只把相关成果以论文方式发表在学术起开上,同时决定把相关源代码以 TensorFlow 的方式「一步到位」的开放给工业界。

《TensorFlow会成为Google在AI时代的新「安卓系统」吗?》
《TensorFlow会成为Google在AI时代的新「安卓系统」吗?》

另一方面,尽管 TensorFlow 本身没有任何商业盈利的计划,但它可以成为 Google Cloud 在商业推广上的重要推动力。在 2015 年,在开源 TensorFlow 以后,Google 很快公布了 GoogleCloud ML 服务。这意味着,基于 TensorFlow 生态链的、服务多个大规模计算领域的神经网络(比如 Alpha Go)就会成为 Google cloud 推行「AI 即服务」的杀手锏。

或许就是来源于技术方面的自信,Google 云平台业务的负责人黛安·格林在今年曾经非常乐观的预测,因为有来自人工智能方面的加持,Google cloud 的市场份额将在五年后跃居市场第一。

一个人工智能时代的安卓生态?

就连在 GoogleBrain 工作的工程师都认为,从路径和目标来看,TensorFlow 的开源有着安卓生态故事的影子。

在 Google,一直都有着非常浓厚的开源基因。目前它旗下已经有超过 60 个开源的项目。开源甚至成为了这家公司商业模式的重要组成部分,而安卓的成功让它对这一点更加认同。

进入移动互联网时代后,Google 在 iPhone 大卖后立刻加速了安卓的发布,并且在接下来的时间里不断更新版本,让这个系统在低价手机和高端手机上都能实现完好的适配。这一步基本帮助不擅长硬件的 Google 完成了移动优先的战略转型,防御甚至反击了苹果 iOS 在移动时代的强势进攻。到现在,安卓已然成为 Google 的一个标准平台。

时至今日,Android 身影几乎无所不在。但安卓系统的演进也经历了先求有、再求优的过程。而也正是因为开源,才让谷歌吸引了大量第三方合作伙伴和人才的参与,才建立起了在移动时代的生态系统。

《TensorFlow会成为Google在AI时代的新「安卓系统」吗?》
《TensorFlow会成为Google在AI时代的新「安卓系统」吗?》

(安卓生态的成功,让Google更加相信开源的力量)

Google 一直坚信,能够获得用户的信息和长效依赖,这比用户一时的消费有价值多了。所以在 Google 喊出 AI first 的口号后,开源一个促进机器学习研究和企业应用产品对接的平台,意义不言自明:它有望帮助 Google 构建机器学习领域的产业标准,也能大大降低深度学习在各个行业中的应用难度。使用 TensorFlow 进进行机器学习领域的研究和应用的人越多,就越容易让谷歌在人工智能领域获的主导权。

但结合软件和硬件等方式将 AI 能力开放并输出,这已经是属于科技巨头的兵家必争之地。包括微软、百度和 Facebook 都开放了提供基础路线图的深度学习工具,甚至在 9 月 11 日,Facebook 和微软决定联手开发一个允许人工智能开发者在 Caffe2、Cognitive Toolkit 和 PyTorch 框架下自由互通的格式,该项目被称为 ONNX。

这一步棋,被人们视为 Facebook 和微软两家巨头联手对抗 TensorFlow 而为之。

但单从人工智能服务的输出布局上来看,Google 几乎完全不用担心:在深度学习的生态方面,Google 结合从云到 TPU 再到 TensorFlow 的整体服务矩阵的组合逻辑似乎已经更加完整:TensorFlow 的基础框架和 TPU 的计算能力现在都可以通过 Google cloud 向外输出;在这背后,则是 Google Brain 一刻也不会停歇的基础研究和正在研发中的量子计算。

如果人们曾经认为软件会吞噬世界,那么现在,Google 有了更大的胃口。从这个角度上来说,TensorFlow 和它背后这套 Google 的人工智能「组合拳」,似乎在为一个比移动时代更有「张力」的未来做准备。

AI 即服务:这是未来的方向么?

不过,TensorFlow 本质上还是一个比较底层的框架,它更适合大规模的调度,但也因此常常被工业界吐槽不能满足很多个性化需求,导致不少运行在 TensorFlow 上的具体项目在商业化落地过程过于缓慢。

在知乎上,出门问问 NLP 工程师李理就撰文分析过:「TensorFlow 有意义,但又不是神乎其神的东西……因为在工程界里,若要完成一整件事,如识别语音,TensorFlow 这种通用深度学习框架的存在更多是锦上添花,而非决定根本。」

就拿 TensorFlow 和百度推出的深度学习框架 PaddlePaddle 相比来看,后者似乎更加「务实」,它不仅将源代码开放,而且直接为开发者提供了很多整体解决方案,为开发者提供了快速实现商业化落地的路径。对于这个开放社区来说,百度介入的更深,也表现的更加心急。

不过这本质上指向的是一个关键问题:在技术越来越走向开源的今天,国内科技巨头们正在推崇的「AI as a service」是否是个真正成立的商业命题?

《TensorFlow会成为Google在AI时代的新「安卓系统」吗?》
《TensorFlow会成为Google在AI时代的新「安卓系统」吗?》

(越来越多的科技巨头,喊出了「AI 即服务的口号)

例如,目前腾讯云搭建的卷积神经网络模型, 已经可以让开发者利用 TensorFlow 实现基于 CNN 数字识别的代码;而阿里云推出的 GN5i 也可以一键部署 TensorFlow、caffe 等主流深度学习框架,并且在这个基础上对接了更多开发者的具体需求。

选择这些服务当然会让开发者更加「省心」,即便不能满足开发者 100% 的需求,也能让他们在 90% 的基础上继续开发。但另一方面,选择某一家云计算的服务,也就意味着需要在前期与巨头的设备进行绑定。对中小型创业公司来说可以减少成本,但对不少「有野心」的创业公司来说,这算不上是一个简单的决定。

同时,从另一个角度来说,在未来当 AI 成为一种「普惠」、「民主」的基础能力后,出售 AI 服务的商业价值和想象力还有多大?

当我们把这个问题抛给 Google 时,Google 的工程师们坦承的表示,在 Google Brain 内部对这个问题也有过争论。但目前 TensorFlow 依然采取了比较「保守」的战略:提供更多个性化服务当然可以让平台离商业化更近一步,但当下,依然是不断完善这个社区的基础能力,并且期待开发者能为它带来更多突破——更何况,就连 Dean 自己也预言,想要实现通用型人工智能,大概还需要至少 15 到 50 年的时间。

所以目前 TensorFlow 选择只开源代码,并在运营社区时把更多时间花在了和开发者沟通并且教授专业知识的工作上,以便更多的 Google 员工和 Google 外部人员可以帮助到这个社区。

但包括谷歌在内的许多工程师还在向着通用人工智能这个远大的方向进行长时间的研究。而那些利用开放框架运行的项目和大量数据也能反哺和加速这个过程。

目前 Google Brain 已经把机器翻译、图像分析、医疗、机器人等几个领域作为深度学习重点研究的方向,并且寻找通用的解决方案。比如在医疗影像中,深度学习已经可以使用视网膜影像进行糖尿病的诊断。不过张坤也坦言,这些领域或许不是最「火」的,但却在 Google 的能力范围内。Google的工程师向我们表示:「接下来更近要的是看业界将如何利用 Google 开放的这些能力,也许他们会给整个人工智能在解决实际问题的过程中带来惊喜。」

TensorFlow 已经拥有了超过 500 位代码贡献者,从发布至今,一共有超过 12000 次的代码提交和超过 100 万次的代码库下载。「我们很幸运有机会能与这么多的外部开发人员进行互动,希望对其中的一些人产生积极的影响,并且帮助他们创造基于机器学习的新应用程序。」GoogleBrain 的一位工程师颇有自信的说,「现在我们只需要把事情做好,那么很多数据自然会聚集过来。」

那么,TensorFlow 会成为 AI 时代的新安卓系统么?或许从现在 TensorFlow 业务设置的架构和影响力上,我们还很难给出这样的定义。但这个带有些许「公益」性质的开源工具需要依托更多人和数据的参与才能继续延伸能力,它为 Google 未来在 AI 布局上带来的基础优势还是显而易见的。

更何况,跳出业务和商业计划,这个机器学习时代更具有普适性的「工具」体现的,仍然是 Google 坚持多年「持续开放」、「消除信息死角」的价值观,和它最终期待建立的「AI 民主化」未来。

aHR0cDovL3dlaXhpbi5xcS5jb20vci9rRHRXVGpmRUVtcHRyWE10OTI2Qw== (二维码自动识别)

这是极客公园前沿社超频之旅的系列文章之一。今年九月,我们与国内优秀创业公司的管理者一起走进了硅谷,和 Google、Facebook 以及多个前沿科技公司进行了深度交流。现在,我们选择了这趟旅途中最有价值的思考想和你一起分享,请持续关注前沿社和顶楼带来的后续报道。

顶楼 TopView 是极客公园前沿社的特别内容生产小组,我们关注前沿科技对现在及未来商业所带来的影响,发表最具科技的商业洞见。

原文链接 → 只为商业新变量


推荐阅读
  • 2018年人工智能大数据的爆发,学Java还是Python?
    本文介绍了2018年人工智能大数据的爆发以及学习Java和Python的相关知识。在人工智能和大数据时代,Java和Python这两门编程语言都很优秀且火爆。选择学习哪门语言要根据个人兴趣爱好来决定。Python是一门拥有简洁语法的高级编程语言,容易上手。其特色之一是强制使用空白符作为语句缩进,使得新手可以快速上手。目前,Python在人工智能领域有着广泛的应用。如果对Java、Python或大数据感兴趣,欢迎加入qq群458345782。 ... [详细]
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 微软头条实习生分享深度学习自学指南
    本文介绍了一位微软头条实习生自学深度学习的经验分享,包括学习资源推荐、重要基础知识的学习要点等。作者强调了学好Python和数学基础的重要性,并提供了一些建议。 ... [详细]
  • 近年来,大数据成为互联网世界的新宠儿,被列入阿里巴巴、谷歌等公司的战略规划中,也在政府报告中频繁提及。据《大数据人才报告》显示,目前全国大数据人才仅46万,未来3-5年将出现高达150万的人才缺口。根据领英报告,数据剖析人才供应指数最低,且跳槽速度最快。中国商业结合会数据剖析专业委员会统计显示,未来中国基础性数据剖析人才缺口将高达1400万。目前BAT企业中,60%以上的招聘职位都是针对大数据人才的。 ... [详细]
  • “你永远都不知道明天和‘公司的意外’哪个先来。”疫情期间,这是我们最战战兢兢的心情。但是显然,有些人体会不了。这份行业数据,让笔者“柠檬” ... [详细]
  • [译]技术公司十年经验的职场生涯回顾
    本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同,令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望,认为人类有能力不断改善自己。 ... [详细]
  • 背景应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]
  • 一次上线事故,30岁+的程序员踩坑经验之谈
    本文主要介绍了一位30岁+的程序员在一次上线事故中踩坑的经验之谈。文章提到了在双十一活动期间,作为一个在线医疗项目,他们进行了优惠折扣活动的升级改造。然而,在上线前的最后一天,由于大量数据请求,导致部分接口出现问题。作者通过部署两台opentsdb来解决问题,但读数据的opentsdb仍然经常假死。作者只能查询最近24小时的数据。这次事故给他带来了很多教训和经验。 ... [详细]
  • sklearn数据集库中的常用数据集类型介绍
    本文介绍了sklearn数据集库中常用的数据集类型,包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集,包含了波士顿506处房屋的13种不同特征以及房屋价格,适用于回归任务。 ... [详细]
  • 分享2款网站程序源码/主题等后门检测工具
    本文介绍了2款用于检测网站程序源码和主题中是否存在后门的工具,分别是WebShellkiller和D盾_Web查杀。WebShellkiller是一款支持webshell和暗链扫描的工具,采用多重检测引擎和智能检测模型,能够更精准地检测出已知和未知的后门文件。D盾_Web查杀则使用自行研发的代码分析引擎,能够分析更为隐藏的WebShell后门行为。 ... [详细]
  • Google在I/O开发者大会详细介绍Android N系统的更新和安全性提升
    Google在2016年的I/O开发者大会上详细介绍了Android N系统的更新和安全性提升。Android N系统在安全方面支持无缝升级更新和修补漏洞,引入了基于文件的数据加密系统和移动版本的Chrome浏览器可以识别恶意网站等新的安全机制。在性能方面,Android N内置了先进的图形处理系统Vulkan,加入了JIT编译器以提高安装效率和减少应用程序的占用空间。此外,Android N还具有自动关闭长时间未使用的后台应用程序来释放系统资源的机制。 ... [详细]
  • 浏览器中的异常检测算法及其在深度学习中的应用
    本文介绍了在浏览器中进行异常检测的算法,包括统计学方法和机器学习方法,并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测,可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率,而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]
  • 大数据Hadoop生态(20)MapReduce框架原理OutputFormat的开发笔记
    本文介绍了大数据Hadoop生态(20)MapReduce框架原理OutputFormat的开发笔记,包括outputFormat接口实现类、自定义outputFormat步骤和案例。案例中将包含nty的日志输出到nty.log文件,其他日志输出到other.log文件。同时提供了一些相关网址供参考。 ... [详细]
  • 数据结构与算法的重要性及基本概念、存储结构和算法分析
    数据结构与算法在编程领域中的重要性不可忽视,无论从事何种岗位,都需要掌握数据结构和算法。本文介绍了数据结构与算法的基本概念、存储结构和算法分析。其中包括线性结构、树结构、图结构、栈、队列、串、查找、排序等内容。此外,还介绍了图论算法、贪婪算法、分治算法、动态规划、随机化算法和回溯算法等高级数据结构和算法。掌握这些知识对于提高编程能力、解决问题具有重要意义。 ... [详细]
  • AI行业的下一个风口是医疗?创业者们这样说
    ▼点击上方蓝字关注网易智能为你解读AI领域大公司大事件,新观点新应用编者按:4月10日,鲸准AI产业价值峰会在北京举行。本次大会除了邀请A ... [详细]
author-avatar
手机用户2502937963
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有