热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

大数据平台十大能力

大数据公司遍地开花,有的做PaaS有的做SaaS,每一家都会根据自己的产品定位、适用的业务场景突出大数据平台的能力,同时,大数据平台又可以有无数个技术点。而面对客户时,有时候客户更

大数据公司基因不同侧重点也不同,有的做PaaS有的做SaaS,有的做SI,每一家都会根据自己的产品定位、适用的业务场景突出大数据平台的能力。而客户和用户更关注你的大数据平台是什么架构具有哪些技术能力。以下抛开零碎的技术细节,概括性系统性的分享大数据平台的能力。



  1. 基于存储和计算分离的架构

    在传统MPP架构下,计算存储共享一个节点,每个节点有自己独立的CPU、内存、磁盘资源,互相不共享,不太容易满足云时代不同场景下的不同workload需求。

    而通过分离存储资源、计算资源,可以独立规划存储、计算的资源规格和容量。这样计算资源的扩容、缩容、释放,均可以比较快完成,并且不会带来额外的数据搬迁的代价。存储、计算也可以更好的结合各自的特征,选择更适合自己的资源规格和设计。

    image.png

  2. 基于云原生的数据平台

    基于云平台进行构建、部署和交付的数据库服务。

    公有云和私有云部署:支持微软、亚马逊、阿里云等公有云平台。

    容器部署支持:Docker与Kubernetes。

  3. 面向开源生态的存储引擎

    与Hadoop生态融合。

    Hadoop Native:从存储(HDFS),资源管理(YARN)到部署(Ambari)。

    轻松访问所有HDFS数据(TXT、CSV、ORC等)和外部系统数据(例如,Hive)。

    开发插件来访问新的数据源:高级C/C++访问库到HDFS和YARN:libHDFS3和libYARN。

    结合新的执行器,外部存储的性能得到很大提升。

  4. 基于并行处理和代价的优化器

    负责接受查询树,生成查询计划。针对一个查询,可能有数亿个等价的查询计划,但执行性能差别很大。优化器的作用是找出优化的查询计划。

    优化器基于代价而不是基于规则。

  5. 基于SIMD(单指令多数据流)的执行器

    执行器是数据库最核心的部件之一,新一代SIMD执行器使用了多项专利技术,可以充分利用最新CPU的每一个特性,比如SIMD(单指令多数据流),可以做到指令内并行,达到性能的极致。比其他数据库要快一个量级以上。

  6. 基于Raft协议的一致性

    raft是工程上使用较为广泛的强一致性、去中心化、高可用的分布式协议。

    分布式存储系统通常通过维护多个副本来进行容错,提高系统的可用性。要实现此目标,就必须要解决分布式存储系统的最核心问题:维护多个副本的一致性。

  7. 基于数据挖掘的机器学习函数库

    为AI应用开发者提供的机器学习函数库,包含大部分通用深度学习算法函数,并针对分布式架构进行了优化,易于使用及高性能。

  8. 面向复杂网络环境下的跨域数据共享交换技术

    跨域共享交换面向复杂网络条件下的数据交换需求,通过建立统一的数据生成、采集、处理、传输、交换的应用服务渠道,搭建统一的开发配置、部署、监控和服务体系,实现数据交换全生命周期的信息化管理和应用能力。

    核心能力包括:

    1、确保交换业务的全程安全保密性,支持多种算法的数据加解密,保障信息的跨安全域交换的安全可控性。支持与专业安全传输设备协同传输的方式,支持在不同密级、不同网域、不同场景下的协同联动;

    2、实现跨层级、跨部门、跨应用业务的交换服务,满足不同组织结构内部数据共享和业务协同;

    3、支持多种交换任务触发方式,包括定时/实时触发器、时间戳、标志位等多种数据捕捉方式,支持任务的人工审核和系统自动触发的能力;

    4、支持基于数据库库表、数据文件的资源目录服务管理,实现统一配置部署、运维监控的交换管理;

    5、支持路由转发功能,实现节点间数据交换和远程管理。

  9. 基于数据全生命周期的安全体系

    提供敏感数据识别、数据安全审计、数据脱敏、智能异常检测等安全能力,形成一体化的数据安全解决方案。

    以及多种认证手段,包括:信任认证、口令认证、Kerberos认证、基于Ident认证、通过TCP/IP 进行Ident认证、通过本地套接字进行Ident认证、Ident映射、LDAP认证、PAM 认证。

    加密技术保障数据传输、数据接入和数据存储安全。

  10. 基于多维属性的数据权限管理技术

    基于资源统一定义和管理框架为角色以及资源叠加附件属性策略和限制条件,支撑在策略执行点的动态权限管控;以继承模型实现角色和权限的复用,避免每次由于权限和业务变动产生的大量新增问题;通过融合不同权限模型结合在应用运行时权限决策点实时计算实现基于属性策略的权限控制,解决传统数据权限管理存在权限与角色紧耦合,扩展性、动态性、可控性较差等问题。



推荐阅读
  • Tomcat/Jetty为何选择扩展线程池而不是使用JDK原生线程池?
    本文探讨了Tomcat和Jetty选择扩展线程池而不是使用JDK原生线程池的原因。通过比较IO密集型任务和CPU密集型任务的特点,解释了为何Tomcat和Jetty需要扩展线程池来提高并发度和任务处理速度。同时,介绍了JDK原生线程池的工作流程。 ... [详细]
  • 在Docker中,将主机目录挂载到容器中作为volume使用时,常常会遇到文件权限问题。这是因为容器内外的UID不同所导致的。本文介绍了解决这个问题的方法,包括使用gosu和suexec工具以及在Dockerfile中配置volume的权限。通过这些方法,可以避免在使用Docker时出现无写权限的情况。 ... [详细]
  • Spring特性实现接口多类的动态调用详解
    本文详细介绍了如何使用Spring特性实现接口多类的动态调用。通过对Spring IoC容器的基础类BeanFactory和ApplicationContext的介绍,以及getBeansOfType方法的应用,解决了在实际工作中遇到的接口及多个实现类的问题。同时,文章还提到了SPI使用的不便之处,并介绍了借助ApplicationContext实现需求的方法。阅读本文,你将了解到Spring特性的实现原理和实际应用方式。 ... [详细]
  • 本文介绍了Hyperledger Fabric外部链码构建与运行的相关知识,包括在Hyperledger Fabric 2.0版本之前链码构建和运行的困难性,外部构建模式的实现原理以及外部构建和运行API的使用方法。通过本文的介绍,读者可以了解到如何利用外部构建和运行的方式来实现链码的构建和运行,并且不再受限于特定的语言和部署环境。 ... [详细]
  • CentOS 7部署KVM虚拟化环境之一架构介绍
    本文介绍了CentOS 7部署KVM虚拟化环境的架构,详细解释了虚拟化技术的概念和原理,包括全虚拟化和半虚拟化。同时介绍了虚拟机的概念和虚拟化软件的作用。 ... [详细]
  • 本文介绍了在Docker容器技术中限制容器对CPU的使用的方法,包括使用-c参数设置容器的内存限额,以及通过设置工作线程数量来充分利用CPU资源。同时,还介绍了容器权重分配的情况,以及如何通过top命令查看容器在CPU资源紧张情况下的使用情况。 ... [详细]
  • Oracle优化新常态的五大禁止及其性能隐患
    本文介绍了Oracle优化新常态中的五大禁止措施,包括禁止外键、禁止视图、禁止触发器、禁止存储过程和禁止JOB,并分析了这些禁止措施可能带来的性能隐患。文章还讨论了这些禁止措施在C/S架构和B/S架构中的不同应用情况,并提出了解决方案。 ... [详细]
  • 本文介绍了H5游戏性能优化和调试技巧,包括从问题表象出发进行优化、排除外部问题导致的卡顿、帧率设定、减少drawcall的方法、UI优化和图集渲染等八个理念。对于游戏程序员来说,解决游戏性能问题是一个关键的任务,本文提供了一些有用的参考价值。摘要长度为183字。 ... [详细]
  • Jboss的EJB部署描述符standardjaws.xml配置步骤详解
    本文详细介绍了Jboss的EJB部署描述符standardjaws.xml的配置步骤,包括映射CMP实体EJB、数据源连接池的获取以及数据库配置等内容。 ... [详细]
  • 本文探讨了容器技术在安全方面面临的挑战,并提出了相应的解决方案。多租户保护、用户访问控制、中毒的镜像、验证和加密、容器守护以及容器监控都是容器技术中需要关注的安全问题。通过在虚拟机中运行容器、限制特权升级、使用受信任的镜像库、进行验证和加密、限制容器守护进程的访问以及监控容器栈,可以提高容器技术的安全性。未来,随着容器技术的发展,还需解决诸如硬件支持、软件定义基础设施集成等挑战。 ... [详细]
  • 容器管理与容器监控influxDB
    容器管理与容器监控-influxDB什么是influxDBinfluxDB安装(1)下载镜像(2)创建容器(3 ... [详细]
  • {moduleinfo:{card_count:[{count_phone:1,count:1}],search_count:[{count_phone:4 ... [详细]
  • mysqldinitializeconsole失败_mysql03误删除了所有用户解决办法
    误删除了所有用户解决办法第一种方法(企业常用)1.将数据库down掉[rootdb03mysql]#etcinit.dmysqldstopShuttingdownMySQL..SU ... [详细]
  • Webmin远程命令执行漏洞复现及防护方法
    本文介绍了Webmin远程命令执行漏洞CVE-2019-15107的漏洞详情和复现方法,同时提供了防护方法。漏洞存在于Webmin的找回密码页面中,攻击者无需权限即可注入命令并执行任意系统命令。文章还提供了相关参考链接和搭建靶场的步骤。此外,还指出了参考链接中的数据包不准确的问题,并解释了漏洞触发的条件。最后,给出了防护方法以避免受到该漏洞的攻击。 ... [详细]
  • 如何使用PLEX播放组播、抓取信号源以及设置路由器
    本文介绍了如何使用PLEX播放组播、抓取信号源以及设置路由器。通过使用xTeve软件和M3U源,用户可以在PLEX上实现直播功能,并且可以自动匹配EPG信息和定时录制节目。同时,本文还提供了从华为itv盒子提取组播地址的方法以及如何在ASUS固件路由器上设置IPTV。在使用PLEX之前,建议先使用VLC测试是否可以正常播放UDPXY转发的iptv流。最后,本文还介绍了docker版xTeve的设置方法。 ... [详细]
author-avatar
是唐雨冰吗
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有