热门标签 | HotTags
当前位置:  开发笔记 > 人工智能 > 正文

一文带你从传统到云趋势看ETL的状态

一文带你从传统到云趋势看ETL的状态-每个企业里的每个部门、每个团队都拥有潜在的高价值数据宝库,但很可惜其中的73%未被使用到,因为缺乏相应的数据整合工具,所以ETL是解决这个问题

每个企业里的每个部门、每个团队都拥有潜在的高价值数据宝库,但很可惜其中的73%未被使用到,因为缺乏相应的数据整合工具,所以ETL是解决这个问题的很好办法。然而,最初的ETL流程是为十年前的业务需求而构建的,现在的时代已经变了。

当今的企业拥有的数据源数量正在以非常高的速度增长着,有研究表明,现代企业可以在其的环境中拥有多达400个企业应用程序,以及产生大量数据的社交媒体平台和移动技术。为了整合这一切,管理数据的领导者需要以新的方法来整合这些历史数据,以利用这些数据来进行战略业务规划。

过去的ETL

在过去,少数数据源的ETL流程可以由简单的工具处理完成。然而,随着数据量和的增加,系统和流程出现故障的概率也在不断增加,因为传统的ETL工具带有一连串的缺点。

对于初学者来说,许多ETL功能历来都是手动编码的,这是一个漫长且复杂的过程,手工编码的过程非常具有挑战性:一个开发人员难以学习另一个开发人员的代码,导致许多开发人员必须从头开始重写代码,增加了操作的时间和费用。更糟糕的是,每当团队成员离开或代码(或配置)未记录在案时,公司就会面临很大的风险。就日常运营和对业务用户的影响而言,本地ETL系统在为企业做出明智决策所需的洞察力方面一直很慢。

这些系统通常用于批处理,通常会迫使企业在非工作时间(例如夜间)里使用计算资源来运行ETL进行作业,最终会导致更高的成本、功耗、硬件和人员开销,以及更高的停机或服务中断的风险。

现代基于云的ETL

传统的ETL流程特征是批量提取数据,在暂存区对其进行转换,然后将其加载到数据仓库或其他地方,但是该模型不符合现代业务需求。

在当今的业务环境中,数据提取必须实时工作,并为用户提供自助服务功能,以便随时运行查询并查看当前情况。而且,随着公司越来越多地将更多的应用程序和工作负载迁移到云端了,他们将面临成倍增长的数据集以及来自众多渠道的数据源,所以ETL工具必须可以毫不费力地处理这些大量的数据。

现代ETL工具应该能够在任何云产品上运行良好,并且应该能够随着公司更换云的提供商而轻松迁移,还必须具有良好的容错性、安全性、可扩展性和端到端的准确性,尤其是在为新的机器学习 (ML) 或人工智能 (AI) 模型提供关键信息时,可以做出准确且更具前瞻性的判断。

比较表

现在是实现ETL现代化的时候了

关于云ETL的工具挺多的,这里重点介绍一个Smartbi智分析的云ETL工具,功能非常强大,处理过程非常智能,通过鼠标简单的拖拽便可以进行复杂的ETL程序。最具有价值的地方是它的云属性,只要有网络便可以随时随地进行工作,不受限于时间与空间。


推荐阅读
  • 如何使用代理服务器进行网页抓取?
    本文介绍了如何使用代理服务器进行网页抓取,并探讨了数据驱动对竞争优势的重要性。通过网页抓取,企业可以快速获取并分析大量与需求相关的数据,从而制定营销战略。同时,网页抓取还可以帮助电子商务公司在竞争对手的网站上下载数百页的有用数据,提高销售增长和毛利率。 ... [详细]
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 本文介绍了adg架构设置在企业数据治理中的应用。随着信息技术的发展,企业IT系统的快速发展使得数据成为企业业务增长的新动力,但同时也带来了数据冗余、数据难发现、效率低下、资源消耗等问题。本文讨论了企业面临的几类尖锐问题,并提出了解决方案,包括确保库表结构与系统测试版本一致、避免数据冗余、快速定位问题等。此外,本文还探讨了adg架构在大版本升级、上云服务和微服务治理方面的应用。通过本文的介绍,读者可以了解到adg架构设置的重要性及其在企业数据治理中的应用。 ... [详细]
  • 分享2款网站程序源码/主题等后门检测工具
    本文介绍了2款用于检测网站程序源码和主题中是否存在后门的工具,分别是WebShellkiller和D盾_Web查杀。WebShellkiller是一款支持webshell和暗链扫描的工具,采用多重检测引擎和智能检测模型,能够更精准地检测出已知和未知的后门文件。D盾_Web查杀则使用自行研发的代码分析引擎,能够分析更为隐藏的WebShell后门行为。 ... [详细]
  • 浏览器中的异常检测算法及其在深度学习中的应用
    本文介绍了在浏览器中进行异常检测的算法,包括统计学方法和机器学习方法,并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测,可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率,而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]
  • 背景应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]
  • 本文比较了eBPF和WebAssembly作为云原生VM的特点和应用领域。eBPF作为运行在Linux内核中的轻量级代码执行沙箱,适用于网络或安全相关的任务;而WebAssembly作为图灵完备的语言,在商业应用中具有优势。同时,介绍了WebAssembly在Linux内核中运行的尝试以及基于LLVM的云原生WebAssembly编译器WasmEdge Runtime的案例,展示了WebAssembly作为原生应用程序的潜力。 ... [详细]
  • 近年来,大数据成为互联网世界的新宠儿,被列入阿里巴巴、谷歌等公司的战略规划中,也在政府报告中频繁提及。据《大数据人才报告》显示,目前全国大数据人才仅46万,未来3-5年将出现高达150万的人才缺口。根据领英报告,数据剖析人才供应指数最低,且跳槽速度最快。中国商业结合会数据剖析专业委员会统计显示,未来中国基础性数据剖析人才缺口将高达1400万。目前BAT企业中,60%以上的招聘职位都是针对大数据人才的。 ... [详细]
  • Tomcat/Jetty为何选择扩展线程池而不是使用JDK原生线程池?
    本文探讨了Tomcat和Jetty选择扩展线程池而不是使用JDK原生线程池的原因。通过比较IO密集型任务和CPU密集型任务的特点,解释了为何Tomcat和Jetty需要扩展线程池来提高并发度和任务处理速度。同时,介绍了JDK原生线程池的工作流程。 ... [详细]
  • 本文介绍了如何使用python从列表中删除所有的零,并将结果以列表形式输出,同时提供了示例格式。 ... [详细]
  • Java学习笔记之面向对象编程(OOP)
    本文介绍了Java学习笔记中的面向对象编程(OOP)内容,包括OOP的三大特性(封装、继承、多态)和五大原则(单一职责原则、开放封闭原则、里式替换原则、依赖倒置原则)。通过学习OOP,可以提高代码复用性、拓展性和安全性。 ... [详细]
  • 本文介绍了绕过WAF的XSS检测机制的方法,包括确定payload结构、测试和混淆。同时提出了一种构建XSS payload的方法,该payload与安全机制使用的正则表达式不匹配。通过清理用户输入、转义输出、使用文档对象模型(DOM)接收器和源、实施适当的跨域资源共享(CORS)策略和其他安全策略,可以有效阻止XSS漏洞。但是,WAF或自定义过滤器仍然被广泛使用来增加安全性。本文的方法可以绕过这种安全机制,构建与正则表达式不匹配的XSS payload。 ... [详细]
  • GPT-3发布,动动手指就能自动生成代码的神器来了!
    近日,OpenAI发布了最新的NLP模型GPT-3,该模型在GitHub趋势榜上名列前茅。GPT-3使用的数据集容量达到45TB,参数个数高达1750亿,训练好的模型需要700G的硬盘空间来存储。一位开发者根据GPT-3模型上线了一个名为debuid的网站,用户只需用英语描述需求,前端代码就能自动生成。这个神奇的功能让许多程序员感到惊讶。去年,OpenAI在与世界冠军OG战队的表演赛中展示了他们的强化学习模型,在限定条件下以2:0完胜人类冠军。 ... [详细]
  • 数据结构与算法的重要性及基本概念、存储结构和算法分析
    数据结构与算法在编程领域中的重要性不可忽视,无论从事何种岗位,都需要掌握数据结构和算法。本文介绍了数据结构与算法的基本概念、存储结构和算法分析。其中包括线性结构、树结构、图结构、栈、队列、串、查找、排序等内容。此外,还介绍了图论算法、贪婪算法、分治算法、动态规划、随机化算法和回溯算法等高级数据结构和算法。掌握这些知识对于提高编程能力、解决问题具有重要意义。 ... [详细]
  • 杭州PHP大厂有哪些(2023年最新分享)
    导读:今天编程笔记来给各位分享关于杭州PHP大厂有哪些的相关内容,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!本文目录一览: ... [详细]
author-avatar
小丸子2502856277_253
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有