热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

明略科技的工业互联网思路:数据、AI、知识图谱

工业互联网是中国工业从「中国制造」到「中国智造」的一个转折点,也被认为是中国可能存在的工业弯道超车的契机之一。中国企业面对这个契机,尚有一个问题需要考虑——过去一百年欧美走过的工业

工业互联网是中国工业从「中国制造」到「中国智造」的一个转折点,也被认为是中国可能存在的工业弯道超车的契机之一。

中国企业面对这个契机,尚有一个问题需要考虑——过去一百年欧美走过的工业化道路是否仍需国内工业产业继续跟进研发、“跑数据”?

行业内的一个普遍认知是,中国工业化道路仍需从数字化、甚至自动化继续长跑补课。

然而,就当下这波工业互联网热潮而言,中国企业的热情已经远超欧美及其他国家,正如麦肯锡全球资深董事合伙人、亚洲运营咨询业务及物联网负责人Karel Eloot向雷锋网(公众号:雷锋网)提及工业物联网趋势时所谈,“在中国,人们非常热衷于思考工业物联网,原因是他们认为这是一种更快缩小与发达国家差距的方法,是一种跨越式的进步,而不仅仅是从法国或德国学习成功经验。”

在这样的背景下,中国企业出现了诸如三一重工孵化的树根互联、TCL孵化的格创东智这样的工业互联网平台厂商,也有阿里、华为等互联网企业的入局,以及在工业互联网平台、AI算法、大数据等方面的诸多创业企业。

其中,工业互联网平台、AI算法及大数据成为当下国内工业互联网创业中两大热门创业方向,明略科技属于后者,主要构建了自家的AI和大数据平台。

明略科技成立于2014年,随着2019年3月明略完成20亿元D轮融资,明略数据升级为明略科技集团,随后又公布了新的人事任命,任命丁伟庆为明略科技集团高级副总裁,主要负责明略科技集团公共服务事业群旗下工业及物联网业务并协同公共服务事业群整体管理工作。至此,明略科技在工业互联网领域的布局也逐渐呈现。

据悉,丁伟庆此前历任施耐德电气(中国)有限公司高级副总裁、诺基亚西门子网络通信公司副总裁、中国移动客户业务总经理、湖南华诺技术有限公司总裁。雷锋网特别采访了丁伟庆,就明略科技在工业互联网领域技术布局及相关发展思路进行了梳理和分析。

明略科技的工业互联网思路:数据、AI、知识图谱

基于「224战略」的工业互联网技术体系

2019年3月27日对于明略科技来说是企业发展的一个关键时间节点,明略科技在这一天正式对外公布,「明略数据」升级为「明略科技集团」,并成立了ESG(Enterprise Service Group,企业服务事业群)、PSG(Public Service Group,公共服务事业群)、NSG(New Service Group,新服务事业群)三大事业群。

据官方信息显示,PSG主要为公共安全、应急管理、工业互联网、数字城市、金融等领域的政府机构和企业,提供从识别、理解、分析、决策到行动的闭环智能建设,构建知识图谱,通过感知和认知的连接,实现传统企业数字化、智能化转型。

“大数据分析和应用、知识图谱、基于多模态人工智能人机协作平台、数据中台,以及数据知识双驱动的推理和推荐引擎,是明略的五大核心技术。”丁伟庆告诉雷锋网。

这样的的技术架构也贯穿了整个工业互联网BU,这主要体现在PSG的「224战略」(2大应用、2大战略市场、4大产品线)上。

针对「224战略」,丁伟庆向雷锋网解释如下:

“2”大战略市场:

  • 第一类,国家安全、智慧治理以及城市管理;

  • 第二类,大型组织的高效运转和企业加速创新。

“2”大应用:

  • 第一,基于人和组织社会行为动态数据的分析挖掘与智能应用;

  • 第二,基于设备和装备物联感知(AIoT)动态数据的分析挖掘与智能应用。

“4”大产品线:

  • 第一,数据中台。通过构建数据中台,汇聚治理多源异构数据,盘活数据资产,形成客户全面感知平台;

  • 第二,明智系统。基于数据中台,构建行业知识图谱和认知分析模型,形成客户全面认知平台;

  • 第三,业务中台。基于数据中台和明智系统,构建客户业务中台,支持客户多种行动智能应用;

  • 第四,智能设备。打造服务大AI闭环应用的一体化智能设备,包括边缘计算智能终端、雾计算智能服务器、专用服务器、定制服务器、安全服务器等。

明略科技的工业互联网思路:数据、AI、知识图谱

明略科技的“224战略”

聚焦到工业互联网领域,丁伟庆也解释了这一战略的具体打法:

针对工业设备的动态数据,充分采集、汇聚、挖掘、提炼;然后利用知识图谱、人工智能的能力,解决行业运营、建设、生产、管理所遇到的问题,从而通过数字化、网络化、智能化促进整个工业智能化发展。

感知:从数据收集到数据治理

类似于自动驾驶技术发展的阶段划分,明略科技基于数据应用能力,具体将企业智能化转型划分为识别、理解、分析、决策、创新5个阶段。在这5个阶段中,主要强调的则是对数据的感知和认知能力。

针对数据感知能力,明略科技构建了多维感知数据汇聚平台、数据治理管理平台、数据存储、数据共享服务构成的数据中台,这一平台通过采集、爬取、探查、汇聚和解析各种结构化和非结构化数据,实现对数据的融合打通、关联建模。

多源异构的数据包括设备本身运行的数据、传感器收集的数据,以及环境中摄像头上传的视频数据,这些数据分为结构化、非结构化、半结构化数据,明略科技主要对这些数据实现感知。

明略科技的工业互联网思路:数据、AI、知识图谱

数据中台架构

工业互联网中的数据与物联网领域数据有所不同,首先是数据量相对不够大,其次是对数据质量有高要求。

“在消费领域,通用大数据构建的深度学习模型是不可解释的,这对要求高可靠的工业来说是不可接受的。”ABB首席技术官刘前进此前就工业大数据曾这样表示。

此前在消费领域盛行的相关关系也可能不再通行,因果关系仍将是很长一段时间工业领域追求的目标。

对此,丁伟庆告诉雷锋网,“面对数据量不够,不足以支撑相关关系的时候,要利用大量先验知识,即此前积累下的知识降低计算模型对数据数量的依赖。把行业知识图谱充分利用起来,可以缓解或一定程度上解决当下工业大数据面临的挑战。”

明略科技的数据感知更多是在讲数据采集、数据治理,无论是结构化数据,还是非结构化数据,当下工业环境中高质量的大数据仍是需解决的第一道难题。针对数据感知,明略也构建了一套数据治理平台和工具。这套数据治理平台主要包括以下三个方面:

  • CONA,结构化通用治理平台。可实现数据接入、数据清洗、数据融合、数据标准化、数据监控和数据管理。能够大规模自动采集、清洗、归类、关联所有结构化数据,形成统一数据视图,提高行业知识图谱构建效率。

  • Raptor,非结构化文本治理产品。一种基于深度学习模型的非结构化文本治理产品,采用深度学习模型和主动学习技术,支持外部NLP模型,可快速、高效地完成数据标注。

通过这两大工具,能够帮助收集、整理、汇聚数据。

  • HARTS,关联知识挖掘产品。基于各行业的基础信息、标签特征、轨迹行 为、交易记录、通联事件、围栏卡口等数据,通过规则引擎、机器学习、图挖掘等多种计算方法,分析、挖掘和推理出多元化对象之间多维度的关联关系,用于行业大脑的知识积累、符号计算和智能推理。

认知:知识图谱构建思路

除去数据采集、数据治理之外,明略科技也在基于大数据和AI技术构建行业知识图谱,即知识图谱数据库蜂巢(NEST)。

明略科技的知识图谱数据库蜂巢,是将机器大脑中的知识库、人工智能应用的基础设施,基于创新性的混合存储技术,向下对接多种形式的结构化/非结构化数据融合为统一的多维度关联知识图谱,向上为业务应用提供基础的图谱查询能力和复杂的图谱分析计算能力。

据悉,蜂巢将所有数据以实体、关系、事件、文档 的形式存储,形成包含二维关联信息、时空信息、历史状态信息、隐性关联信息、非结构化模糊关联多个层次的大知识基础, 结合多元化检索、复杂图谱分析、在线关系挖掘等技术,为业务应用提供了兼具深度和广度的高性能知识服务。

明略科技的工业互联网思路:数据、AI、知识图谱

蜂巢核心功能

基于蜂巢,明略科技还构建了可视化知识分析平台SCOPA。该平台支持海量数据图谱的高效存储、分析与挖掘,可以根据业务场景和数据图谱特点,提供关系网络分析、时空轨迹碰撞、实时多维检索、信息比对碰撞、智能协作系统、实时数据接入、智能交互等功能。

知识图谱构建虽然能够降低工业数据模型对大数据的依赖,然而就工业领域数据量不足与知识图谱构建其实在一定程度上存在相互制约关系。工业互联网整体起步较晚,行业领域碎片化严重,使得工业领域知识图谱的构建缺乏数据、缺乏先验知识。

丁伟庆告诉雷锋网,明略科技知识图谱的数据来源主要有两方面:

  • 第一,重要的技术、管理人员,在行业所获取的知识、经验和能力后,把这些内容数字化,作为行业知识图谱重要的数据来源之一;

  • 第二,管理数据,例如设备运行故障处理的日志等材料,由此积累形成的行业强相关的规则、经验。

明略科技最早入局的是安防领域,因而知识图谱的构建也是从安防领域开始。据丁伟庆介绍,明略科技在公安领域构建的知识图谱已经应用多年。

公安系统主要是利用知识图谱提高整体破案效率。我们在公安系统中的整个知识图谱,把多源异构的数据,例如,人、事、地、物的数据、姓名、身份、出行记录、住宿记录、通信记录等数据结合起来,再根据破案的需求,通过逻辑判断,快速缩小嫌疑犯的范围,在有限的时间内锁定嫌疑犯,从而缩短破案时间。

具体到工业领域的知识图谱的构建,丁伟庆告诉雷锋网,知识图谱在工业领域使用的逻辑是一样的,将诸如维修手册、工人维修经验、网络上关于设备维修的方法的数据进行提炼,形成知识图谱。通过知识图谱对多源异构的数据进行分析提炼,形成针对某一类设备的智能维修知识图谱。“我们针对工业领域部分设备已经有实际客户案例。”

在知识图谱使用过程中,对数据和经验的收集是不断迭代形成的。具体是根据使用过程用户反馈,进行不断调整。

与此同时,丁伟庆特别强调,明略有很多在行业里面浸染多年,对行业的业务、行业的规则都很熟悉的行业专家,这些行业专家不是简单地只知道行业知识,而是本身必须跨界的能力,很强的学习能力,是相对混合型的人才。

明智系统2.0:数据中台、AI中台的技术融合

围绕大数据、AI技术,明略科技分别构建起数据中台和AI中台,基于此,在不同行业可以构建各自的业务中台。与此同时,明略科技构建的明智系统也已经迭代到2.0版本,拥有语音识别、机器视觉、自然语言文本处理、结构化数据治理、规则引擎等技术能力。

明略科技的工业互联网思路:数据、AI、知识图谱

明智系统2.0产品体系

2018年9月,明略科技推出明智系统2.0版本。“相较2017年发布的明智系统1.0版本,2.0版本在多源异构数据治理能力、AI分析能力、精确度,以及两个系统之间的协同能力都有所提高。另外,这一版本打通了从感知到认知,再到行动的系统,形成了AI闭环。”

明智系统2.0的产品逻辑是用符号打通感知和认知,构建AI驱动的数据治理平台,并以感知智能技术为基础,构建完整的行业人工智能大脑——蜂巢NEST。

具体而言,

明智系统2.0通过“符号的力量”完成对于行业数据中所蕴含知识的抽取、融合、推理、和沉淀等一系列过程,打通感知智能;

此外,明智系统2.0还强化了认知智能,将多元异构数据通过动态索引及知识分析技术进行充分融合,在此基础上开展逻辑推理及复杂运算。基于语义的分析检索等各类场景应用也可以通过“明察”引擎进行加速完成。

明略科技正是以此支撑起明略科技业务平台,支撑起其行动系统。具体明略科技业务平台架构如下图所示:

明略科技的工业互联网思路:数据、AI、知识图谱

明略科技业务平台架构

据明略科技官方信息显示,明略科技深度参与国家发展改革委于2019年批复的增强制造业核心竞争力关键技术产业化项目(即:轨道交通行业的国家级示范工程项目)车辆智能运维系统R.I.S.E平台。

明略科技参与了RISE平台车联网系统的多源异构大数据平台和核心车联网技术系统构建。前者,主要是将车辆实时的传感器数据,非结构化的视频、图片数据,融入平台,作为数据管理的核心支撑整个车辆智能运维系统;后者主要是通过物联网和大数据技术的结合,使用数据网关、行为解析以及实时处理的技术,实现车辆智能运维分析。

据悉,通过已经落地实施的车联网系统,上海申通地铁原来每天要做的日检工作,通过信息化手段,实现每8天一检,大大减轻运维工作量。截至8月底,RISE平台中的车联网系统已在上海申通地铁11条线路的部分车型部署上线。

工业互联网,明略的发展思路

工业互联网,为中国工业企业带来了什么?

目前可见的是,包括国家政策、经济环境、市场需求、企业痛点都在朝着利好工业互联网发展的方向进行。企业升级转型,工业互联网成为必然选择。

“国际上,数字化、网络化到智能化,相对而言是一个串联的进程。在中国,我们不能完全照搬国外的情况,因为中国有很多中小企业数字化做得还不够好。中国企业应该利用中国的后发优势,按照并联的方式,加速智能化进程。”

工业互联网初期,一百个企业有一百个不同的发展思路。明略科技希望通过构建数据中台、AI中台,通过打通感知、认知、行动系统,实现AI闭环落地,这也是明略科技的HAO智能理论。而在这样的道路上,既需要不断有行业高质量数据为其数据中台输血,也需要有AI技术能力为其AI中台提供底层技术能力。

从丁伟庆的介绍中可见,前者,明略科技通过与行业合作伙伴合作、培养行业专家,以及跨功能、组织的多元异构数据共享进行数据汇集、治理和共享;后者,明略科技在2018年7月成立了明略科学院,从事AI基础技术能力的研发工作,为AI中台持续供血。

在这样的技术体系和产品体系下,明略科技已经开始落地工业互联网项目。“明略科技将这套产品应用到工业互联网已有两年,目前明略科技在工业互联网领域布局主要聚焦在交通、电力、制造业三大垂直领域。”

此外,值得注意的是,在8月29日开幕的2019世界人工智能大会上,继BAT,科大讯飞,商汤后,科技部再次公布国家新一代人工智能开放创新平台,明略科技也名列其中。

尽管如此,就当下国内工业发展现状而言,要构建起工业领域完整的知识图谱,要实现丁伟庆口中的以并联方式跨过工业数字化进程,进入智能化时代,显然还有很多问题要解决,还有很长的路要走。


推荐阅读
  • 云原生边缘计算之KubeEdge简介及功能特点
    本文介绍了云原生边缘计算中的KubeEdge系统,该系统是一个开源系统,用于将容器化应用程序编排功能扩展到Edge的主机。它基于Kubernetes构建,并为网络应用程序提供基础架构支持。同时,KubeEdge具有离线模式、基于Kubernetes的节点、群集、应用程序和设备管理、资源优化等特点。此外,KubeEdge还支持跨平台工作,在私有、公共和混合云中都可以运行。同时,KubeEdge还提供数据管理和数据分析管道引擎的支持。最后,本文还介绍了KubeEdge系统生成证书的方法。 ... [详细]
  • Linux服务器密码过期策略、登录次数限制、私钥登录等配置方法
    本文介绍了在Linux服务器上进行密码过期策略、登录次数限制、私钥登录等配置的方法。通过修改配置文件中的参数,可以设置密码的有效期、最小间隔时间、最小长度,并在密码过期前进行提示。同时还介绍了如何进行公钥登录和修改默认账户用户名的操作。详细步骤和注意事项可参考本文内容。 ... [详细]
  • Android中高级面试必知必会,积累总结
    本文介绍了Android中高级面试的必知必会内容,并总结了相关经验。文章指出,如今的Android市场对开发人员的要求更高,需要更专业的人才。同时,文章还给出了针对Android岗位的职责和要求,并提供了简历突出的建议。 ... [详细]
  • [译]技术公司十年经验的职场生涯回顾
    本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同,令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望,认为人类有能力不断改善自己。 ... [详细]
  • t-io 2.0.0发布-法网天眼第一版的回顾和更新说明
    本文回顾了t-io 1.x版本的工程结构和性能数据,并介绍了t-io在码云上的成绩和用户反馈。同时,还提到了@openSeLi同学发布的t-io 30W长连接并发压力测试报告。最后,详细介绍了t-io 2.0.0版本的更新内容,包括更简洁的使用方式和内置的httpsession功能。 ... [详细]
  • 浏览器中的异常检测算法及其在深度学习中的应用
    本文介绍了在浏览器中进行异常检测的算法,包括统计学方法和机器学习方法,并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测,可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率,而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]
  • 集成电路企业在进行跨隔离网数据交换时面临着安全性问题,传统的数据交换方式存在安全性堪忧、效率低下等问题。本文以《Ftrans跨网文件安全交换系统》为例,介绍了如何通过丰富的审批流程来满足企业的合规要求,保障数据交换的安全性。 ... [详细]
  • 2018年人工智能大数据的爆发,学Java还是Python?
    本文介绍了2018年人工智能大数据的爆发以及学习Java和Python的相关知识。在人工智能和大数据时代,Java和Python这两门编程语言都很优秀且火爆。选择学习哪门语言要根据个人兴趣爱好来决定。Python是一门拥有简洁语法的高级编程语言,容易上手。其特色之一是强制使用空白符作为语句缩进,使得新手可以快速上手。目前,Python在人工智能领域有着广泛的应用。如果对Java、Python或大数据感兴趣,欢迎加入qq群458345782。 ... [详细]
  • 本文介绍了Java工具类库Hutool,该工具包封装了对文件、流、加密解密、转码、正则、线程、XML等JDK方法的封装,并提供了各种Util工具类。同时,还介绍了Hutool的组件,包括动态代理、布隆过滤、缓存、定时任务等功能。该工具包可以简化Java代码,提高开发效率。 ... [详细]
  • “你永远都不知道明天和‘公司的意外’哪个先来。”疫情期间,这是我们最战战兢兢的心情。但是显然,有些人体会不了。这份行业数据,让笔者“柠檬” ... [详细]
  • 本文介绍了PhysioNet网站提供的生理信号处理工具箱WFDB Toolbox for Matlab的安装和使用方法。通过下载并添加到Matlab路径中或直接在Matlab中输入相关内容,即可完成安装。该工具箱提供了一系列函数,可以方便地处理生理信号数据。详细的安装和使用方法可以参考本文内容。 ... [详细]
  • 本文介绍了高校天文共享平台的开发过程中的思考和规划。该平台旨在为高校学生提供天象预报、科普知识、观测活动、图片分享等功能。文章分析了项目的技术栈选择、网站前端布局、业务流程、数据库结构等方面,并总结了项目存在的问题,如前后端未分离、代码混乱等。作者表示希望通过记录和规划,能够理清思路,进一步完善该平台。 ... [详细]
  • sklearn数据集库中的常用数据集类型介绍
    本文介绍了sklearn数据集库中常用的数据集类型,包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集,包含了波士顿506处房屋的13种不同特征以及房屋价格,适用于回归任务。 ... [详细]
  • flowable工作流 流程变量_信也科技工作流平台的技术实践
    1背景随着公司业务发展及内部业务流程诉求的增长,目前信息化系统不能够很好满足期望,主要体现如下:目前OA流程引擎无法满足企业特定业务流程需求,且移动端体 ... [详细]
  • RouterOS 5.16软路由安装图解教程
    本文介绍了如何安装RouterOS 5.16软路由系统,包括系统要求、安装步骤和登录方式。同时提供了详细的图解教程,方便读者进行操作。 ... [详细]
author-avatar
手机用户2502930623
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有