热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

尝试用AI「收垃圾」,深度学习模型训练到部署一站式落实到位

近年来,我国加速推行垃圾分类制度,2021年5月,国家发改委和住建部联合发布《“十四五”城镇生活垃圾分类和处理设施发展规划》,

022a49d54f8a6ed6ab178be317d73a39.png

近年来,我国加速推行垃圾分类制度,2021年5月,国家发改委和住建部联合发布《“十四五”城镇生活垃圾分类和处理设施发展规划》,要求到2025年底,京津冀及周边、长三角、粤港澳大湾区、长江经济带、黄河流域、生态文明试验区具备条件的县城基本建成生活垃圾分类和处理系统;鼓励其他地区积极提升垃圾分类和处理设施覆盖水平。

自此,垃圾分类成为国策。

437871f5f5c2a799a6f4e4048c1176b9.png

你也许会以为,这是一个脏活、累活、苦活,这样的设想也不为过。但是,你可能不知道,这其中也蕴藏着巨大的经济价值。

我国是人口大国,也是垃圾产生大国,2021年我国生活垃圾产量为27097.2万吨。

由于统计口径的不同,对于垃圾分类市场的市场价值评估差别较大,但即使按较保守的计算,这也是一个千亿级市场。如果按照我们的调查,仅仅一个宁波市,每年回收废弃物的价值就高达560亿人民币。

如果有一种方法,既可以解决垃圾分类中的苦、脏、累,又能提升分拣效率、提升行业效率,让“变废为宝”成为一件相对轻松的工作,是否是一个社会期待的满意选择?

为了这个目标,AI 来了。

 01 聚焦宁波 

6月24日,世界银行执行董事会批准给中国提供贷款4.3亿美元,其中的1.5亿美元贷款将用于宁波的垃圾分类。

宁波作为东部沿海城市,已经开始采取了先进的垃圾管理、循环利用和预防措施,在国内属于领先位置。

因此,此次的世行资金,主要用于宁波全品类智能回收箱的落地,该项目结合智慧化管理、区块链记账等技术优势对前段垃圾分类用户进行引导、对垃圾回收流程进行大数据分析和智慧化管理,实现对生活垃圾分类端+回收端的清运回收可控管理、成本优化、数据分析,这也标志着宁波即将步入垃圾分类“数智”管理时代。

机会只留给有准备的人,宁波蔚澜就是这样一家企业。此前,它是一家生产物联网配电柜的企业,公司负责人范世杰非常关注市场动态,在2018年底,当他看到央视开始宣传垃圾分类时,立刻产生了一个念头——垃圾分类柜这种东西,本质上和物联网配电柜的差别不大。

范世杰立刻开始市场考察,认为当时市场上生产的垃圾分类柜,以蔚澜的技术完全可以做,于是立刻在2018年11月投入研发,2019年3月拿出了样机。

但是在实践中,他也发现,垃圾分类柜其实涉及到一个复杂的经济闭环。例如,废玻璃回收后,每吨只能卖70-80元,而废纸板每吨却高达2000元以上,但废纸板需要详细分类,因为不同类型的回收价格也不同,所以如果设备能够在前端对垃圾进行更精准的分类,经济效益和整个回收闭环都有很大的优化空间。

所有的垃圾中,最难处理的是厨余垃圾。一般人可能很难想象,散发着异味、容易腐败的厨余垃圾其实有很高的经济价值,但厨余垃圾的处理也是最困难的。很常见的一个问题就是,居民在分类时不够精细,把其它垃圾混杂在厨余垃圾里,这就涉及到两个动作——需要对垃圾进一步分拣,还需要提醒居民注意类似问题。

5fd84c03f49feb527f962278a1dffd8c.png

所以真正的挑战,是增加厨余垃圾分拣这个环节,因为识别难度大增。严格的说,没有自动破袋+厨余垃圾识别的前两代产品,只能叫“自动分类柜”,只有这两个功能完备了,才能叫“智能分类柜”。

让范世杰感到幸运的是,公司新招来了 AI 技术总监杜一品。大家都知道 AI 的人才奇缺,有完整的 AI 开发经验的人更少。

杜一品来到蔚澜之前,也深知这家公司并没有完整的 AI 团队,但是,他有底气,因为掌握了新的工具——百度飞桨企业版 EasyDL。

EasyDL(以及各类的 AutoML/DL)的共同理念,就是“用 AI 技术来帮助人们设计 AI”,换句话说,开发 AI 模型的流程中,涉及的数据处理、特征提取、模型选择、参数调节、训练部署等环节,都利用 AI 能力才实现了高度的自动化,经过简单的学习即可运用。

杜一品用 EasyDL 轻松完成了厨余垃圾识别模型,但一个问题随之而生,对于厨余垃圾的识别需要比较高的 AI 算力,如果回传到云端计算,就需要公司添置大量的服务器、GPU 卡等资源,这极大的增加了利润本身薄如刀锋的垃圾回收行业的成本。

就在这个时候,飞桨工程师给他支招,不需要购买庞大的 AI 计算设备,只需要一个百度的“EdgeBoard 嵌入式 AI 计算卡”再搭配两个普通的摄像头就可以解决问题。

当杜一品把不到2000元的一块 EdgeBoard 计算卡融合进了蔚澜的垃圾分类柜后,他说了一句很感概的话:“我们的设备成本只增加了大约2-3%,就让我们从自动化时代进入了人工智能时代,不得不说,这样的技术才是产业落地真正需要的技术。”

事实上,百度飞桨的价值正在于此,它根据实际需求预制了大量可以灵活搭配的解决方案,即使是宁波蔚澜这样全公司只有极少数懂 AI 的技术人员的企业,也可以借助飞桨丰富的产品和生态,从软件到硬件、从训练到部署,搞定整个设备的 AI 化,企业只需要极低的成本,就把公司带到了一个新的发展境界。

范世杰因而很有感概地说,升级到第三代之后,宁波市场上,基本就没有我们的对手了,这就是 AI 的力量。

其实,宁波蔚澜只是崛起的垃圾回收产业大军中的一员。

垃圾分类可以使垃圾资源利用收益更大化,给产业和社会创造更多价值,具有大力推行的必要性。从产业链协同角度而言,前端的垃圾分类服务、中端的垃圾分类转运、终端的厨余垃圾处理、渗滤液处置、垃圾焚烧等相关企业均将从中受益。

 02 不再只是“先行者” 

一家企业,只有1个或很少几个懂 AI 的人员在做先导,对于这种现象,百度集团副总裁吴甜称之为“AI 先行者”阶段。

对于 AI 落地,吴甜在分享飞桨通过与产业伙伴的广泛合作中所观察到的落地实践路径时,把这条路描绘为三个阶段,也就是先行者探路阶段、工作坊应用阶段和工业大生产阶段。

吴甜发现,企业中的 AI 先行者,往往既不是一线业务人员,也不是高层管理者,而是公司内的一些资深工程师。他们懂业务、懂场景、有想法,想要突破传统的业务现状,希望借助 AI 的力量走出一条不一样的路。

cc167bbd2a7ca8efff451a312169aceb.png

我们所说的垃圾分类行业,就是这样一个典型场景。

垃圾分类庞大的市场空间,吸引了投资人和创业者纷纷进场,成为当下创投行业的一大热门。企查查数据显示,我国垃圾分类相关的企业注册量呈现快速增加的趋势,2016年垃圾分类相关企业注册量不足1000家,2020年的注册量为3775家。

但是,可以想见的是,传统的垃圾分类企业要在全社会 AI 人才存在较大缺口的背景下,招募到有一定水平的 AI 开发专才,是有明显的困难的。

而对于这种情况,飞桨 EasyDL、BML 等低门槛的企业级 AI 开发工具,就极大的降低了垃圾分类企业的开发难度,出现了“一个人能撑起一家企业的”的情况。

例如,宁波蔚澜的 AI 技术总监就告诉笔者,在与飞桨 EasyDL 合作之前也考察过别的公司,包括阿里、华为及国外的平台,最终发现飞桨 EasyDL 相对更好用、更人性化,他说:“EasyDL 最大的好处,就是不需要高深的算法基础和深度学习知识,也可以去操作它。集成到系统里也很方便。”

 03 以生态能力反碎片化 

事实上,EasyDL 能提供端到端完整的解决方案,包括用于数据服务的 EasyData 和用于边缘计算的 EdgeBoard 硬件等。

不得不提及的是,EasyDL 可以在数据量较小的情况下仍然取得不错的模型效果,这对于很多处于「投石探路」阶段的企业有很大的现实意义。

例如和中国香港的屈臣氏合作的深圳归谷智能公司,2019年接到香港环保署的项目,要做一个识别瓶子的项目。虽然看起来简单,但实际中瓶子的形状各异。归谷智能一开始使用的是其他开源代码,但识别率不足六成,但在换为 EasyDL 之后,短时间达到了准确率90%以上。

令归谷智能的技术人员感到惊讶的是,训练中只用了100多个瓶子、800多张照片,用 EasyDL 训练后的识别率、准确率,就差不多达到实战要求,“这个算法听起来不难,但我们发现目前国际上同类算法能达到类似效果的公司估计也就是2、3家,其中有一个超难的进阶试验是,把两个高度类似的瓶子的条码互换,要求能够识别。这个试验里只有用了 EasyDL 的机器识别出来了,别的公司的设备一个都没有识别出来。”

这典型的体现了在小数据量的情况下,EasyDL 的训练效果。

其实,从以上几个故事中,我们不难发现一些共性,那就是虽然场景很碎片化,但实际的实践难度却很高。

8ec31bea8c2125a9d5ef0fd2faa86c2a.png

在目前 AI 落地的浪潮中,有一个存在争议的领域就是,对于过于碎片化的场景,到底如何「反碎片化」,是用更多的专业人员+成本更高的定制化方案,抑或用学习曲线更低、企业业务人员自己稍加训练就可以上场的 EasyDL。

从这些故事中我们得出的结论是,让企业的开发人员自己具有 AI 能力无疑是最好的反碎片策略,但这必须建立在所依托的深度学习平台的高度产业化上,在这个过程中,除了 EasyDL、BML 外,笔者还见到了犹如电商页面一样的 EdgeBoard 的选购页面,百度飞桨就是通过不放过每一个痛点,把经过上万个场景的千锤百炼的模型,与实践过程中可以遇到的数据问题、软硬件整合问题,都提供了端到端的一站式解决,才具备了完整的反碎片能力。

垃圾分类只是我们整个社会「数智化」的一个缩影,当这么传统的领域也开始让 AI 开始施展魔力之时,我们距离 AI 融入工业大生产的目标,似乎又近了一些。

c45f5b986f20ace685966c57e6ad93fd.png

59b31188b60999316bdaa37db7089cd1.png

福利时间

希望体验EasyDL零门槛AI开发平台的用户,可以通过“阅读原文”领取专项AI基金。可用于:EasyDL公有云平台的线上付费商品,如模型训练按机型付费、公有云API调用、私有服务器部署训练号购买、设备端SDK序列号购买等。


推荐阅读
  • 背景应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]
  • 计算机存储系统的层次结构及其优势
    本文介绍了计算机存储系统的层次结构,包括高速缓存、主存储器和辅助存储器三个层次。通过分层存储数据可以提高程序的执行效率。计算机存储系统的层次结构将各种不同存储容量、存取速度和价格的存储器有机组合成整体,形成可寻址存储空间比主存储器空间大得多的存储整体。由于辅助存储器容量大、价格低,使得整体存储系统的平均价格降低。同时,高速缓存的存取速度可以和CPU的工作速度相匹配,进一步提高程序执行效率。 ... [详细]
  • “你永远都不知道明天和‘公司的意外’哪个先来。”疫情期间,这是我们最战战兢兢的心情。但是显然,有些人体会不了。这份行业数据,让笔者“柠檬” ... [详细]
  • 2018年人工智能大数据的爆发,学Java还是Python?
    本文介绍了2018年人工智能大数据的爆发以及学习Java和Python的相关知识。在人工智能和大数据时代,Java和Python这两门编程语言都很优秀且火爆。选择学习哪门语言要根据个人兴趣爱好来决定。Python是一门拥有简洁语法的高级编程语言,容易上手。其特色之一是强制使用空白符作为语句缩进,使得新手可以快速上手。目前,Python在人工智能领域有着广泛的应用。如果对Java、Python或大数据感兴趣,欢迎加入qq群458345782。 ... [详细]
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 本文讨论了同事工资打听的话题,包括同工不同酬现象、打探工资的途径、为什么打听别人的工资、职业的本质、商业价值与工资的关系,以及如何面对同事工资比自己高的情况和凸显自己的商业价值。故事中的阿巧发现同事的工资比自己高后感到不满,通过与老公、闺蜜交流和搜索相关关键词来寻求解决办法。 ... [详细]
  • [译]技术公司十年经验的职场生涯回顾
    本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同,令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望,认为人类有能力不断改善自己。 ... [详细]
  • 不同优化算法的比较分析及实验验证
    本文介绍了神经网络优化中常用的优化方法,包括学习率调整和梯度估计修正,并通过实验验证了不同优化算法的效果。实验结果表明,Adam算法在综合考虑学习率调整和梯度估计修正方面表现较好。该研究对于优化神经网络的训练过程具有指导意义。 ... [详细]
  • 利用Visual Basic开发SAP接口程序初探的方法与原理
    本文介绍了利用Visual Basic开发SAP接口程序的方法与原理,以及SAP R/3系统的特点和二次开发平台ABAP的使用。通过程序接口自动读取SAP R/3的数据表或视图,在外部进行处理和利用水晶报表等工具生成符合中国人习惯的报表样式。具体介绍了RFC调用的原理和模型,并强调本文主要不讨论SAP R/3函数的开发,而是针对使用SAP的公司的非ABAP开发人员提供了初步的接口程序开发指导。 ... [详细]
  • WebSocket与Socket.io的理解
    WebSocketprotocol是HTML5一种新的协议。它的最大特点就是,服务器可以主动向客户端推送信息,客户端也可以主动向服务器发送信息,是真正的双向平等对话,属于服务器推送 ... [详细]
  • 如何使用代理服务器进行网页抓取?
    本文介绍了如何使用代理服务器进行网页抓取,并探讨了数据驱动对竞争优势的重要性。通过网页抓取,企业可以快速获取并分析大量与需求相关的数据,从而制定营销战略。同时,网页抓取还可以帮助电子商务公司在竞争对手的网站上下载数百页的有用数据,提高销售增长和毛利率。 ... [详细]
  • 本文介绍了Python语言程序设计中文件和数据格式化的操作,包括使用np.savetext保存文本文件,对文本文件和二进制文件进行统一的操作步骤,以及使用Numpy模块进行数据可视化编程的指南。同时还提供了一些关于Python的测试题。 ... [详细]
  • AI行业的下一个风口是医疗?创业者们这样说
    ▼点击上方蓝字关注网易智能为你解读AI领域大公司大事件,新观点新应用编者按:4月10日,鲸准AI产业价值峰会在北京举行。本次大会除了邀请A ... [详细]
  • 本文详细介绍了云服务器API接口的概念和作用,以及如何使用API接口管理云上资源和开发应用程序。通过创建实例API、调整实例配置API、关闭实例API和退还实例API等功能,可以实现云服务器的创建、配置修改和销毁等操作。对于想要学习云服务器API接口的人来说,本文提供了详细的入门指南和使用方法。如果想进一步了解相关知识或阅读更多相关文章,请关注编程笔记行业资讯频道。 ... [详细]
  • 本文介绍了Web学习历程记录中关于Tomcat的基本概念和配置。首先解释了Web静态Web资源和动态Web资源的概念,以及C/S架构和B/S架构的区别。然后介绍了常见的Web服务器,包括Weblogic、WebSphere和Tomcat。接着详细讲解了Tomcat的虚拟主机、web应用和虚拟路径映射的概念和配置过程。最后简要介绍了http协议的作用。本文内容详实,适合初学者了解Tomcat的基础知识。 ... [详细]
author-avatar
天眞啲笨尛孩
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有