热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

机器学习下一个万亿级的增长从哪来?

简介:果机器学习有望创造可观的价值,那么问题来了:这些价值将在哪里产生呢?在本文中,笔者将介绍三种类型的公司创造并获取价值的方式:应用机器学习的传统公司、构建无行业属性机器学习工具

简介:果机器学习有望创造可观的价值,那么问题来了:这些价值将在哪里产生呢?在本文中,笔者将介绍三种类型的公司创造并获取价值的方式:应用机器学习的传统公司、构建无行业属性机器学习工具的公司以及构建垂直集成机器学习应用的公司。


1.png

在“哈利.波特”的世界中,分院帽是一种算法,可以获得学生的行为历史、喜好和性格等方面的数据,然后据此作出决定,确定学生应该进入霍格沃茨学校里的哪一个分院。如果现实世界里存在这样的分院帽的话,它应该会是机器学习应用程序,可以根据复杂的数据集自主地做出决策。如今,机器学习正在推动数万亿规模的全球产业,例如医疗保健、安全和农业等。

如果机器学习有望创造可观的价值,那么问题来了:这些价值将在哪里产生呢?在本文中,笔者将介绍三种类型的公司创造并获取价值的方式:应用机器学习的传统公司、构建无行业属性机器学习工具的公司以及构建垂直集成机器学习应用的公司。

机器学习不仅仅是科技巨头的游戏

科技巨头在机器学习方面的创新广为人知,从新闻推送到推荐引擎不一而足,但是绝大部分人还没有意识到传统行业对机器学习的需求正在日益增长。预计到2023年,全球人工智能系统支出将达到980亿美元,比2019年支出规模的2.5倍还要多,其中金融服务,零售和汽车领域处于领先地位。

比如,掌管了超过7万亿美元资产的投资管理公司黑石(Blackrock)在2018年推出了几款机器学习支撑的ETF产品。而目前,机器学习也已经在医疗保健行业引发了广泛的关注,涉及医疗影像、诊断和药物发现的机器学习解决方案的预算有望在未来三年内达到100亿美元的规模。

在这些企业客户中,出现了三个广泛的客户群:软件工程师、数据科学家和业务分析师,业务分析师有时也被称为“公民数据科学家”。尽管业务分析师受过的技术培训水平较低,但是他们构成了一个庞大并且不断增长的用户群体,这个群体正在应用机器学习帮助他们的企业利用自身不断增长的数据存储库。

机器学习工具已经渗透进入各行各业

为了适应这些客户群体,希望在这轮淘金热中卖镐的公司数量不断激增。曾经在特斯拉和Snap担任过工程副总裁的Stuart Bowers表示:“挑战并不在于让机器学习变得透明,而是让痛苦的部分(例如日志记录、数据管理、部署和可再现性)变得容易,然后让模型训练变得高效并且可调试。”

作为销售更多基础架构服务策略的一部分,现存的供应商——特别是那些公有云供应商已经采用了“端到端平台”的方式。对于巨头来说,销售机器学习工具是一种推动其客户增加基础设施支出的方式,这意味着他们有能力以很低的成本提供这些工具。

然而,企业从业人员们开始要求“同类最佳”解决方案,而不是那些意在吸引他们购买更多基础架构的工具。为了解决这个问题,下一代的创业企业将会追求更具针对性的方法。和当前各大现有平台广泛采用的模式相反,初创企业可以选择特定问题并开发专用工具,这样可以更有效地解决这些问题。在机器学习工具领域,现在存在着三大问题对用户构成了重大挑战。

数据集管理

虽然机器学习的结果可能看起来很优雅,但实际上,从业人员要将大部分的时间花在数据清理、整理和转换工作上。因为数据越来越多地以各种不同的格式分散在多台机器和云之中,因此将数据变成同一种可消费的格式,让团队能够轻松使用并且将其用于协作是非常困难的一件事。

为了解决这个问题,Tecton 的联合创始人兼首席执行官 Mike Del Balso 正在通过他新的创业公司使他在 Uber 倡导的最佳实践民主化。他表示:“被破坏的数据是导致生产机器学习系统出现问题的最常见原因。建模人员将大部分时间都花在训练时选择和转换功能,然后建立管道,将这些功能传递到生产模型之中。” Tecton 构建了一个平台来管理这些“功能”,并以这种方式来简化数据层的复杂性,从企业原始数据中收集到的智能实时信号对于优化机器学习至关重要。

在更上游,Liquidata 正在为数据库构建开源的 GitHub 等效项。在我与 Liquidata 的联合创始人兼首席执行官 Tim Sehn (他曾经是 Snap 的前工程副总裁)的谈话中,他强调“就像开源软件一样,我们需要在开放数据方面进行协作——在互联网级别。这就是为什么我们创建了 DoltHub 的原因,DoltHub 是互联网上免费存储、托管和协作数据的地方。”

实验跟踪和版本控制

另一个常见的问题是结果之间缺乏可重复性。机器学习模型版本控制的缺位让实验变得很难复现。

正如 Weights and Biases 的联合创始人兼首席执行官 Lukas Biewald 在接受我们的采访时分享的那样,“如今,最大的痛苦是缺乏基本的软件和最佳实践来管理全新的编码风格。你无法使用糟糕的画笔很好地作画,你没有办法在糟糕的 IDE (集成开发环境)中很好地编写代码,你也无法使用我们现在拥有的工具构建和部署很棒的深度学习模型。”他的公司于 2018 年推出了一个实验跟踪解决方案,让 OpenAI 等客户能够将见解从单个研究人员扩散到整个团队。

模型可扩展

对于这个正在成熟的市场来说或,建立基础架构以在生产中扩展模型部署并监控结果是另一个重要的问题。

Anyscale 是开源框架 Ray 背后的公司,这家初创公司已经抽象出了分布式应用程序和可扩展机器学习的基础架构。在我同 Anyscale 的联合创始人兼首席执行官Robert Nishihara 的交谈中,他分享了自己的想法,“就像微软的操作系统为开发人员工具和应用程序创造了一个生态系统一样,我们也在创造基础架构,以支持应用程序和库的富生态系统,从模型训练到部署,让开发人员可以轻松地扩展机器学习应用程序。”

在自然语言处理或者被称为 NLP 的领域中,可扩展性也在飞速发展。Hugging Face 建立了一个开源库来构建、训练和共享 NLP 模型。该公司的联合创始人兼首席执行官 ClémentDelangue 表示:“过去三年中发生了范式转变,NLP 的转换学习开始极大地改变了将 NLP 集成到业务应用程序中的可用性和准确性。”他表示:“我们让企业有可能在一周而不是几个月之内,将最新研究的 NLP 模型应用于生产。”

其他有前途的初创公司包括 Streamlit,该公司让开发人员可以仅仅使用几行 Python 就创建机器学习应用并立刻进行部署。OctoML 为机器学习应用了附加的智能层,是系统变得更加易于优化和部署。Fiddler Labs 已经建立了 Explainable AI Platform (可解释的人工智能平台),可以不间断地解释和监控生产结果。

要想在与老牌公司的激烈竞争中建立起长期稳固的公司,初创公司必须问自己两个问题:对于哪些客户来说我们是必不可少的?接触这些客户的最佳方式是什么?

很多初创公司会提出想法,要在某个大市场中占据 1% 的份额,但是通常来说,这些大市场就算没有过度拥挤,其中的需求也已经得到了很好地满足。专注于赢得核心客户群的公司必须展现出强大的早期吸引力,这将转化为长期扩展潜力。为了吸引这些客户,Databricks 和 Datarobot 等大多数成型企业都采用了自上而下的企业销售方式。与我们在开发人员工具领域中看到的情况类似,我期待着机器学习初创企业最终将从单纯的企业销售发展为推动自下而上的采用,并获得更多优势,胜过当今以企业为中心的成型公司。

垂直集成的机器学习应用程序正在颠覆现状

机器学习领域中一些最令人兴奋的公司正在开拓新的商业模式以颠覆整个行业。汽车行业就是个最明显的例子,仅仅在 2019 年一年,就有 100 亿美元的资金投入到了这个行业。机器学习也将产生革命性影响的下一代垂直市场还包括医疗保健、工业、安全和农业。

Salesforce 的首席科学家 Richard Socher 表示:“在‘机器学习 + X’的模式下,机器学习最为有效。”他表示,“最好的机器学习公司都有着清晰的垂直重点。他们甚至不会将自己定义为机器学习公司。”他认为医疗保健领域是一个非常独特的领域,极有前途:Athelas 已将机器学习应用于免疫监测,通过收集病人白血球数量的数据帮助他们优化药物摄入。Curai 利用机器学习技术来提高医生推荐的效率和质量,让他们可以把更多的时间花在治疗患者的工作上。Zebra 和AIdoc 通过训练数据集来更快地确定医疗状况,从而提高了放射科医生的工作能力。

在工业和物流领域,Covariant 是一家结合了强化学习和神经网络的初创公司,该公司让机器人能够管理大型仓库设施中的物体;Agility and Dexterity 同样在构建机器人,以越来越复杂的方式适应各种不可预测的情况;Interos 应用机器学习技术评估全球供应链网络,帮助企业围绕供应商管理、业务连续性和风险做出关键决策。

在安全和国防领域,Verkada 通过智能地分析实时视频并从中学习,重新构想了企业物理安全;Anduril 建立了一个机器学习主干,该主干可以集成来自传感器塔的数据,以增强国家安全的智能;Shield AI 的软件让无人系统可以解释信号,并且在战场上智能行动。

农业是另一个从机器学习技术中获得巨大收益的垂直领域。John Deere 收购了 Blue River Technology,后者是一家开发智能农作物喷洒设备的初创公司。合并后的公司 Intelligent Solutions Group 的首席科学家Lee Redden 表示:“我们引入计算机视觉技术来识别单株植物并针对单株植物采取行动,通过这种方式改变了农业世界。”其他著名的农科企业还包括 Indigo,该公司将机器学习用于“精准农业”,利用数据,以更有利可图、更具可持续性的方式生产食品。

我们将何去何从?

总结来说,机器学习已经悄然成为我们日常生活的一部分,支撑我们的汽车,医院的运营并保障我们所吃的食物。到目前为止,大型企业孵化了最先进的技术,但是真正的希望存在于下一波机器学习应用程序和工具,将围绕着机器智能各种华而不实的炒作从哈利.波特式的幻想转化为有形的社会价值。

对于机器学习能够在未来几年内创造的价值,我们有很多理由保持乐观。传统企业将训练数以百万计的公民数据科学家,将破碎的行业重塑为更高效的行业。机器学习工具将降低构建智能应用程序的门槛,推动数以百万计的新想法变成产品。垂直机器学习业务模型将让人们获得健康的食品,可靠的人身安全保障和负担得起的医疗保健服务,这是一个民主化的进程。

我们将在这些地方找到机器学习的真正价值。


文章来源:https://yqh.aliyun.com/detail/17328

原文链接:https://developer.aliyun.com/article/768653?

版权声明:如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件至:developerteam@list.alibaba-inc.com 进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容。

推荐阅读
  • SpringBoot整合SpringSecurity+JWT实现单点登录
    SpringBoot整合SpringSecurity+JWT实现单点登录,Go语言社区,Golang程序员人脉社 ... [详细]
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 知识图谱——机器大脑中的知识库
    本文介绍了知识图谱在机器大脑中的应用,以及搜索引擎在知识图谱方面的发展。以谷歌知识图谱为例,说明了知识图谱的智能化特点。通过搜索引擎用户可以获取更加智能化的答案,如搜索关键词"Marie Curie",会得到居里夫人的详细信息以及与之相关的历史人物。知识图谱的出现引起了搜索引擎行业的变革,不仅美国的微软必应,中国的百度、搜狗等搜索引擎公司也纷纷推出了自己的知识图谱。 ... [详细]
  • 自动轮播,反转播放的ViewPagerAdapter的使用方法和效果展示
    本文介绍了如何使用自动轮播、反转播放的ViewPagerAdapter,并展示了其效果。该ViewPagerAdapter支持无限循环、触摸暂停、切换缩放等功能。同时提供了使用GIF.gif的示例和github地址。通过LoopFragmentPagerAdapter类的getActualCount、getActualItem和getActualPagerTitle方法可以实现自定义的循环效果和标题展示。 ... [详细]
  • 本文介绍了OpenStack的逻辑概念以及其构成简介,包括了软件开源项目、基础设施资源管理平台、三大核心组件等内容。同时还介绍了Horizon(UI模块)等相关信息。 ... [详细]
  • ShiftLeft:将静态防护与运行时防护结合的持续性安全防护解决方案
    ShiftLeft公司是一家致力于将应用的静态防护和运行时防护与应用开发自动化工作流相结合以提升软件开发生命周期中的安全性的公司。传统的安全防护方式存在误报率高、人工成本高、耗时长等问题,而ShiftLeft提供的持续性安全防护解决方案能够解决这些问题。通过将下一代静态代码分析与应用开发自动化工作流中涉及的安全工具相结合,ShiftLeft帮助企业实现DevSecOps的安全部分,提供高效、准确的安全能力。 ... [详细]
  • VScode格式化文档换行或不换行的设置方法
    本文介绍了在VScode中设置格式化文档换行或不换行的方法,包括使用插件和修改settings.json文件的内容。详细步骤为:找到settings.json文件,将其中的代码替换为指定的代码。 ... [详细]
  • 本文介绍了在开发Android新闻App时,搭建本地服务器的步骤。通过使用XAMPP软件,可以一键式搭建起开发环境,包括Apache、MySQL、PHP、PERL。在本地服务器上新建数据库和表,并设置相应的属性。最后,给出了创建new表的SQL语句。这个教程适合初学者参考。 ... [详细]
  • 向QTextEdit拖放文件的方法及实现步骤
    本文介绍了在使用QTextEdit时如何实现拖放文件的功能,包括相关的方法和实现步骤。通过重写dragEnterEvent和dropEvent函数,并结合QMimeData和QUrl等类,可以轻松实现向QTextEdit拖放文件的功能。详细的代码实现和说明可以参考本文提供的示例代码。 ... [详细]
  • http:my.oschina.netleejun2005blog136820刚看到群里又有同学在说HTTP协议下的Get请求参数长度是有大小限制的,最大不能超过XX ... [详细]
  • XML介绍与使用的概述及标签规则
    本文介绍了XML的基本概念和用途,包括XML的可扩展性和标签的自定义特性。同时还详细解释了XML标签的规则,包括标签的尖括号和合法标识符的组成,标签必须成对出现的原则以及特殊标签的使用方法。通过本文的阅读,读者可以对XML的基本知识有一个全面的了解。 ... [详细]
  • 本文介绍了Linux系统中正则表达式的基础知识,包括正则表达式的简介、字符分类、普通字符和元字符的区别,以及在学习过程中需要注意的事项。同时提醒读者要注意正则表达式与通配符的区别,并给出了使用正则表达式时的一些建议。本文适合初学者了解Linux系统中的正则表达式,并提供了学习的参考资料。 ... [详细]
  • CF:3D City Model(小思维)问题解析和代码实现
    本文通过解析CF:3D City Model问题,介绍了问题的背景和要求,并给出了相应的代码实现。该问题涉及到在一个矩形的网格上建造城市的情景,每个网格单元可以作为建筑的基础,建筑由多个立方体叠加而成。文章详细讲解了问题的解决思路,并给出了相应的代码实现供读者参考。 ... [详细]
  • 加密世界下一个主流叙事领域:L2、跨链桥、GameFi等
    本文介绍了加密世界下一个主流叙事的七个潜力领域,包括L2、跨链桥、GameFi等。L2作为以太坊的二层解决方案,在过去一年取得了巨大成功,跨链桥和互操作性是多链Web3中最重要的因素。去中心化的数据存储领域也具有巨大潜力,未来云存储市场有望达到1500亿美元。DAO和社交代币将成为购买和控制现实世界资产的重要方式,而GameFi作为数字资产在高收入游戏中的应用有望推动数字资产走向主流。衍生品市场也在不断发展壮大。 ... [详细]
  • Sleuth+zipkin链路追踪SpringCloud微服务的解决方案
    在庞大的微服务群中,随着业务扩展,微服务个数增多,系统调用链路复杂化。Sleuth+zipkin是解决SpringCloud微服务定位和追踪的方案。通过TraceId将不同服务调用的日志串联起来,实现请求链路跟踪。通过Feign调用和Request传递TraceId,将整个调用链路的服务日志归组合并,提供定位和追踪的功能。 ... [详细]
author-avatar
手机用户2602915215
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有