热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

大数据分析工具盘点你不知道的15个新技术

大数据中的大作为,最近几周业内都忙碌着,很多初创公司和一些老牌的公司都推出了数据分析和数据管理产品,以及更新了现有产品,提供更丰富的功能与性能。虽然这些技术都还只是蓝图规划

  大数据中的大作为,最近几周业内都忙碌着,很多初创公司和一些老牌的公司都推出了数据分析和数据管理产品,以及更新了现有产品,提供更丰富的功能与性能。

  虽然这些技术都还只是蓝图规划,但是一些常见的主题还是对其贯穿始终:为用户提供简单的获得数据的访问方式,更好的管理大规模数据以及预先分析的功能,例如Spark、HAWQ和Geode等新兴的大数据技术来实现更多的功能。

  下面一起来看看吸引眼球的十五项大数据公告。虽然罗列了很多,但还不是全部内容,只是最近在加利福尼亚州圣何塞市Strata + Hadoop World大会上亮相的部分技术。

  1.Altiscale Insight Cloud

  Altiscale作为大数据服务的提供者,最近推出了Altiscale Insight Cloud产品,是一个自主服务型的数据分析服务产品,能够帮助业务分析人员使用BI工具等类似于Tableau和Excel的产品,实现快速的数据湖查询,而不需要IT部门投入过多的精力参与。

  Altiscal Insight

  Cloud可以驱动SQL查询、动态可视化、实时仪表板和其他报告及分析能力。它不再因为聚合数据而需要一个单独的关系数据存储,绕过了价格昂贵的、专属的数据库系统。

  Altiscale还与Tableau建立了一个战略联盟,能够让Altiscale客户通过使用Tableau的数据可视化软件与Altiscale服务结合的产品,而实现数据发现的应用服务。

  2.AtScale Intelligence Platform 4.0

  AtScale软件提供了一种使用流行的商业智能工具的方法,包括Tableau和Qlik,可以访问存储在Hadoop集群中的数据。该软件创建了Hadoop和第三方工具之间的语义层级,从本上来说,通过联机分析处理服务器而实现多维分析的方法。

  4.0版本提供了多达100项的新功能和系统改进,其中许多都与企业的安全和性能有关。

  新AtScale Hybrid Query

  Service(AtScale混合查询服务),是可以在本地实现支持SQL和MDX查询语言的商业智能工具。由于许多企业和组织在其整个组织中使用多种BI工具,所以说AtScale对于SQL和MDX的支持也就意味着这些企业不需要在其用户的电脑中下载新的客户端软件或者自定义驱动了。

  3.BlueData EPIC Spring Release

  BlueData EPIC是一个大数据即服务平台,旨在减少实施大数据技术的复杂性,例如Hadoop 和Spark。

  EPIC发布的春季版本中提供了几十种的新性能和功能改进,包括在多租户部署中提高服务的安全性和服务质量。该清单包括更多的颗粒资源管理控制、基于QoS的分配、性能优化和用于多租户部署的配额执行功能。

  新版本还支持更大范围的大数据的应用程序和工具,包括用于数据管理和安全管理的Cloudera Navigator以及Ranger,用于大规模并行处理分析的HAWQ,以及Geode、Cassandra和用于实时分析的Kafka。

  4.Domo商务云

  Domo 商务云是一个对于商务管理应用的生态系统,包括免费和付费的预包装,为企业决策者提供数据、见解和访问的支持,以及所有可以帮助找到商务问题的答案,甚至是特定行业和特定角色中。该公司提供云计算的免费版本,如果用户需要存储更多的数据或者获取更先进的企业功能,例如行政管制得话需要另行付费。

  Domo最近还推出了应用商店,带有1000多个商务管理应用以扩张商务云系统,并开始了Domo应用发布合作伙伴计划,为第三方独立软件开发商开发商务云软件。

  Domo同时还推出了Buzz,是与商务云一起工作的社交协作平台,以及允许商务云访问任何移动设备的Domo Mobile产品。

  5.Kyvos Insights With Azure HDInsight

  Kyvos Insights的旗舰产品运行在Hadoop系统上,并允许企业用户通过可视化,探索和分析的存储在Hadoop中大数据的可大规模扩展的联机分析处理(OLAP)系统。

  该Kyvos软件现在与Azure的HDInsight协同工作,微软基于云计算的Hadoop的平台,可以帮助Azure HDInsight用户通过部署Kyvos从而实现分析任务。

  6.IBM云数据服务的Looker Blocks

  Looker为基于Web的商业智能平台提供了访问驻留在数据库中或者云中的数据。去年,该公司推出了被称为Looker Blocks的可复用、可定制的业务逻辑组件,可以创建完整的业务分析查询功能。

  Looker与IBM合作开发了一套Looker

  Blocks组件,通过利用IBM的云数据服务实现更加简化和可定制的数据分析服务。根据这两家公司所称,该组合将允许客户在数天内部署一个完整的数据平台。

  7.MapD Technologies GPU-Powered Database

  MapD Technologies推出了新的数据库和可视化分析软件,利用图形处理单元芯片帮助数据分析师交互式地探索大型数据集。

  通过利用GPU的强大动力,数据库可以在每台服务器将近4000个核上并行查询,比领先的内存数据库提供更快的性能。使用带有MapD

  Immerse分析前端工具的数据库可以更快的处理复杂数据库的可视性问题。(例如政治捐款,在此地图上就可以看到数据)。

  8.MemSQL 5

  MemSQL开发了其同名的数据库,用于事务处理和实时分析。在该公司公布的最新版本MemSQL5中,提供了一系列的新技术和增强的功能,以提高软件的数据库、数据仓库和流媒体的工作负载性能。

  在新版本中,通过混合的事务处理或者分析处理将事务和分析合并成一个单一的数据库,以支持OLTP和OLAP查询。用户可以在大量的写入负载中实现实时查询。借助于可插拔的认证模块以及类似于Kerberos的工具提高了安全性。用户可以通过使用MemSQLStreamliner来部署Apache Spark,创建了用户可视化界面的实时数据管道,同时消除了批量的ETL任务。

  9.Paxata Spring ’16 Release

  Paxata的自适应数据准备平台,建立在Apache Spark之上,运行在最优化的Hadoop环境中,提供了数据集成、数据质量、语义丰富、协作和管理能力。

  新版本提高了软件的能力,通过先进filtergrams综合数据分析,跨越列宽数据集的细粒度搜索,对于数据发现与统计选项的新的选择,以及在Hadoop压缩文件下集成复杂的嵌套JSON/XML数据,为用户提供了连接信息的能力。

  该版本还包括新的IT控制,以提高系统的管理、安全性和规模。

  10.Platfora Big Data Discovery 5.2

  Platfora是一个很大的数据发现平台,建立本地的Apache Hadoop和Spark。最新的版本”democratizes(民主化)”大数据,使其更容易使用现有的商业智能工具来访问Hadoop数据。

  新版本提供了本地Tableau直接出口,用以准备和丰富数据集成的Tableau

  (画面数据提取)数据到Tableau桌面和Tableau服务器中。其他前端BI工具可以通过lens-accelerated SQL访问Platfora数据,通过SparkSQL和ODBC处理查询。

  Platfora5.2也直接运行在Hadoop集群上,除了传统的专用配置外,可以助其更容易地利用现有的硬件,并重新调整计算资源。用于数据可视化的Platfora

  Vizboard已经得到增强,能够”更加智能化”的默认可视化效果。

  11.Ryft One Cluster

  Ryft系统开发的硬件/软件设备,使用FPGA的并行处理能力处理器加速了tb和pb级别的数据分析能力。

  新版的Ryft One Cluster使用带有开放API接口的混合FPGA/x86计算架构,该公司表示,这可以实现以100倍的速度加速大数据生态系统的发展,同时降低70%的成本。

  新系统扩展了数据分析性能和存储线性,处理分析速度达到每秒200GB以上。它可以作为一个独立的群集或作为现有的Apache Spark系统或其他大数据生态系统的一部分工作。

  12.Tableau 9.3

  Tableau公布了Tableau 9.3全面上市,在最新的版本中,其最受欢迎的数据可视化软件可以永久地连接桌面功能和Snowflake Elastic Data数据仓库。

  Tableau Desktop的”一直连接”功能可以更容易的与他人分享结果,同时留存在流动的分析过程中。该软件的全球地图覆盖功能获得了显著地提升,新数据添加到了地址解析数据库和Tableau Map Service中。

  在9.3版本中,本地连接到本机连接到Snowflake Computing的云数据仓库系统更易于Tableau用户执行简单和复杂数据探索和分析。这两家公司还将继续合作,帮助客户将他们的业务分析过程转移到云端。

  13.Talena ActiveRx

  Telena的软件是用于在测试和开发、备份和恢复、归档和法规遵从和灾难恢复系统中优化数据。

  Talena最近推出了ActiveRx,是一款新的预测分析软件,它采用机器学习算法和数据可视化,以更好地管理大数据的管理工作负载,和更准确地预测数据的可用性。

  ActiveX软件还提供了”驱动副本分析”功能,企业可以用它来把闲置的备份数据转换成有用的资产。

  14.Tamr Apache Spark Compatibility

  Tamr的数据统一平台拥有丰富的企业的数据 ,汇聚了从企业内部和外部的数百甚至数千数据源进行分析。

  Tamr宣布其软件可与Apache Spark兼容,其内存处理引擎可用于扩展机器学习,Tamr表示,其补充了机器驱动方式以备企业数据之需。

  Tamr也在开发开放的接口和核心组件来支持由Spark驱动的数据监护系统。

  15.Trifacta Photon

  Trifacta开发了”数据争论”软件,揭开了光子计算框架,新技术的核心用户界面,在大规模的内存数据集时为用户提供了丰富的交互式数据探索和转型的经验。

  数据争论是原始数据的转化过程,将复杂的数据转换成清洁的,结构化的数据转化成可分析的,这是数据分析过程中最具有挑战性的一个部分。

  Photon产品符合Apache Arrow内存数据架构的说明要求,在与数据内容交互的时候为用户提供了即时的反馈。Photon引擎在更高水平的计算中实现更多的数据探索。

  本文出自柠檬派 http://www.lemonpai.com/1489.html   请务必保留此出处 ,否则将追究法律责任!


大数据分析工具盘点-你不知道的15个新技术


推荐阅读
  • 本文内容为asp.net微信公众平台开发的目录汇总,包括数据库设计、多层架构框架搭建和入口实现、微信消息封装及反射赋值、关注事件、用户记录、回复文本消息、图文消息、服务搭建(接入)、自定义菜单等。同时提供了示例代码和相关的后台管理功能。内容涵盖了多个方面,适合综合运用。 ... [详细]
  • 本文介绍了lua语言中闭包的特性及其在模式匹配、日期处理、编译和模块化等方面的应用。lua中的闭包是严格遵循词法定界的第一类值,函数可以作为变量自由传递,也可以作为参数传递给其他函数。这些特性使得lua语言具有极大的灵活性,为程序开发带来了便利。 ... [详细]
  • 本文介绍了使用Java实现大数乘法的分治算法,包括输入数据的处理、普通大数乘法的结果和Karatsuba大数乘法的结果。通过改变long类型可以适应不同范围的大数乘法计算。 ... [详细]
  • HDU 2372 El Dorado(DP)的最长上升子序列长度求解方法
    本文介绍了解决HDU 2372 El Dorado问题的一种动态规划方法,通过循环k的方式求解最长上升子序列的长度。具体实现过程包括初始化dp数组、读取数列、计算最长上升子序列长度等步骤。 ... [详细]
  • 本文讨论了Alink回归预测的不完善问题,指出目前主要针对Python做案例,对其他语言支持不足。同时介绍了pom.xml文件的基本结构和使用方法,以及Maven的相关知识。最后,对Alink回归预测的未来发展提出了期待。 ... [详细]
  • 本文讨论了如何优化解决hdu 1003 java题目的动态规划方法,通过分析加法规则和最大和的性质,提出了一种优化的思路。具体方法是,当从1加到n为负时,即sum(1,n)sum(n,s),可以继续加法计算。同时,还考虑了两种特殊情况:都是负数的情况和有0的情况。最后,通过使用Scanner类来获取输入数据。 ... [详细]
  • 本文介绍了OC学习笔记中的@property和@synthesize,包括属性的定义和合成的使用方法。通过示例代码详细讲解了@property和@synthesize的作用和用法。 ... [详细]
  • 本文介绍了在SpringBoot中集成thymeleaf前端模版的配置步骤,包括在application.properties配置文件中添加thymeleaf的配置信息,引入thymeleaf的jar包,以及创建PageController并添加index方法。 ... [详细]
  • 知识图谱——机器大脑中的知识库
    本文介绍了知识图谱在机器大脑中的应用,以及搜索引擎在知识图谱方面的发展。以谷歌知识图谱为例,说明了知识图谱的智能化特点。通过搜索引擎用户可以获取更加智能化的答案,如搜索关键词"Marie Curie",会得到居里夫人的详细信息以及与之相关的历史人物。知识图谱的出现引起了搜索引擎行业的变革,不仅美国的微软必应,中国的百度、搜狗等搜索引擎公司也纷纷推出了自己的知识图谱。 ... [详细]
  • 本文讲述了作者通过点火测试男友的性格和承受能力,以考验婚姻问题。作者故意不安慰男友并再次点火,观察他的反应。这个行为是善意的玩人,旨在了解男友的性格和避免婚姻问题。 ... [详细]
  • 本文详细介绍了Linux中进程控制块PCBtask_struct结构体的结构和作用,包括进程状态、进程号、待处理信号、进程地址空间、调度标志、锁深度、基本时间片、调度策略以及内存管理信息等方面的内容。阅读本文可以更加深入地了解Linux进程管理的原理和机制。 ... [详细]
  • 1,关于死锁的理解死锁,我们可以简单的理解为是两个线程同时使用同一资源,两个线程又得不到相应的资源而造成永无相互等待的情况。 2,模拟死锁背景介绍:我们创建一个朋友 ... [详细]
  • 后台获取视图对应的字符串
    1.帮助类后台获取视图对应的字符串publicclassViewHelper{将View输出为字符串(注:不会执行对应的ac ... [详细]
  • 《数据结构》学习笔记3——串匹配算法性能评估
    本文主要讨论串匹配算法的性能评估,包括模式匹配、字符种类数量、算法复杂度等内容。通过借助C++中的头文件和库,可以实现对串的匹配操作。其中蛮力算法的复杂度为O(m*n),通过随机取出长度为m的子串作为模式P,在文本T中进行匹配,统计平均复杂度。对于成功和失败的匹配分别进行测试,分析其平均复杂度。详情请参考相关学习资源。 ... [详细]
  • 本文介绍了通过ABAP开发往外网发邮件的需求,并提供了配置和代码整理的资料。其中包括了配置SAP邮件服务器的步骤和ABAP写发送邮件代码的过程。通过RZ10配置参数和icm/server_port_1的设定,可以实现向Sap User和外部邮件发送邮件的功能。希望对需要的开发人员有帮助。摘要长度:184字。 ... [详细]
author-avatar
非船_725
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有