热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

什么是OLAP?

文章目录1.1、OLAP简介1.2、什么是OLAP?1.3、OLAP可以对多维数据库执行五种类型:1.4、OLAP架构1.4、OLAP(在


文章目录

    • 1.1、OLAP 简介
    • 1.2、什么是OLAP?
    • 1.3、OLAP 可以对 多维数据库 执行五种类型:
    • 1.4、OLAP 架构
    • 1.4、OLAP(在线分析处理)基本上分为三种类型:
    • 1.5、用途和优势
    • 1.6、缺点
  • 关注我的公众号【宝哥大数据】,更多干货


1.1、OLAP 简介

OLAP 是在线分析处理,顾名思义就是OLAP是用于数据分析的;因此,它使我们能够同时分析来自多个数据库系统的信息。换句话说,我们可以说它是一种计算方法,可以让用户轻松提取所需的数据并查询数据,以便从不同的角度进行分析。


  • 它基本上是基于庞大的数据,称为数据仓库;
  • 它从数据仓库中收集所需的数据并执行业务所需的分析,以在业务中做出一些决策,以提高利润、改善销售、改善品牌、改善营销等等。
  • 因此,它在商业智能中用于趋势分析、销售预测、财务报告、计划目的、预算等方面的查询辅助。

1.2、什么是OLAP?

OLAP 是 OLAP(在线分析处理)是许多商业智能 (BI) 应用程序背后的一项强大技术,它可以发现数据、报告查看功能、复杂的分析计算以及预测性“假设”场景、预算计划、预测计划。

例如,用户可以请求分析数据以显示显示 8 月份在孟买上映的所有电影的电子表格,将收入数字与 12 月同一部电影的收入数字进行比较,然后查看其他电影的比较以检查是否在同一时间段内取得更高的成功并成为有利可图的。因此,通过这种分析,将能够决定电影应该在哪里发行以及通过哪些方式获得更多利润,甚至这种数据分析也有助于规划营销策略,例如在哪里进行营销,如何进行,通过哪些方式进行营销。频道做等。

现在我们将看到 OLAP 是如何工作的


  • 首先从多个数据源(如电子表格、视频、XML 等)收集数据并存储在数据仓库中

  • 然后将其清理并组织成数据立方体(data cube)。

之所以成为立方体(Cube),是因为数据按三个维度或者多个维度分类。因此,每个立方体都包含由数据仓库中的多维表导出的按某些维度(例如客户、时间段、地理销售区域和产品)分类的数据。维度可以由成员填充,也可以用于可以采用分层组织的客户姓名、国家和月份等值的维度,并希望对特定值执行分析。OLAP 多维数据集针对跨维度的频繁查询进行了预先汇总,从而提高了关系数据库的查询执行时间。所以像这样,它可以在一段时间内执行不同类型的分析。

与 OLAP 一样,我们使用的另一个术语是 OLTP,即在线事务处理;两者都是在线处理系统


  • OLTP 是事务处理,主要关注事务任务上的任务,
  • 而 OLAP 是一个分析处理系统,主要关注分析和报告,并为他们提供有价值的见解以改进业务。

OLAP 使销售、管理报告、营销、业务流程管理、财务报告、预算和预测等业务报告的工作变得如此轻松。


1.3、OLAP 可以对 多维数据库 执行五种类型:


  • 汇总(Roll-up): 也称为向上钻取或合并,用于汇总操作数据和维度。
  • 下钻(Roll-down): 在数据维度中进行更深入的分析。例如,从“时间段”向下钻取“年”、“月”和“天”等以绘制产品的销售增长图。
  • 切片(Slice): 执行分析以显示一级信息,例如“2019 年的销售额”。
  • 切块(Dice): 进行分析,从多个维度中选取数据进行分析,例如“班加罗尔2019年青苹果的销售额”。
  • 旋转(Pivot): 执行可以通过旋转多维数据集的数据轴来获得新数据视图的分析。

由于 OLAP 给出具有维度的立方体,然后找到维度的交集,例如,在特定时间段内,孟买的所有电影都是有利可图的,并显示结果。每个 OLAP 多维数据集都包含数百个度量,这些度量至少有一个可能,这些度量实际上是从存储在数据仓库的事实表中的信息中派生出来的。


1.4、OLAP 架构

在这里插入图片描述

如图,它通过从多个来源收集数据并存储在数据仓库中开始工作。此外,OLAP 多维数据集是在仓库的清理数据上创建的,用户可以针对这些数据运行查询。


1.4、OLAP(在线分析处理)基本上分为三种类型:

MOLAP(多维 OLAP): MOLAP是一种基于多维数据库索引的 OLAP。

ROLAP (Relational OLAP): ROLAP 是一种对关系数据库存储的数据进行动态多维分析的 OLAP。

HOLAP(混合 OLAP): HOLAP 是 ROLAP 和 MOLAP 的各种集成。用于利用MOLAP开发ROLAP数据容量,超强的处理能力,满足处理需求。


1.5、用途和优势

它可用于数据提取或挖掘、数据分析、报告以发现数据项之间的关系。要从现有关系导入数据,我们可以使用 ODBC(开放数据库连接)来创建 OLAP 多维数据库。趋势分析不需要所有事务数据,因此OLAP数据库不需要像数据仓库那么大。


1.6、缺点

OLAP的一些缺点是必须进行预建模,对IT依赖大,计算能力差,反应慢,缺乏交互分析能力,模型抽象,潜在风险大。

一些分析工具 (OLAP) 是 IBM Cognos、Micro Strategy、Palo OLAP Server、Apache Kylin、Oracle OLAP、icCube、Pentaho BI、JsHypercube 等。


关注我的公众号【宝哥大数据】,更多干货

在这里插入图片描述


推荐阅读
  • 【PPT 下载】这杯网红茶饮,到底赢在哪里?
    【PPT 下载】这杯网红茶饮,到底赢在哪里? ... [详细]
  • Kylin——CDH
    CDH:Cloudera‘sDistribution,includingApacheHadoop.Hadoop众多分支中的一种,可直接用于成产环境CM:Cloudera ... [详细]
  • 一、Hadoop来历Hadoop的思想来源于Google在做搜索引擎的时候出现一个很大的问题就是这么多网页我如何才能以最快的速度来搜索到,由于这个问题Google发明 ... [详细]
  • 本文介绍了如何使用php限制数据库插入的条数并显示每次插入数据库之间的数据数目,以及避免重复提交的方法。同时还介绍了如何限制某一个数据库用户的并发连接数,以及设置数据库的连接数和连接超时时间的方法。最后提供了一些关于浏览器在线用户数和数据库连接数量比例的参考值。 ... [详细]
  • 本文介绍了C#中数据集DataSet对象的使用及相关方法详解,包括DataSet对象的概述、与数据关系对象的互联、Rows集合和Columns集合的组成,以及DataSet对象常用的方法之一——Merge方法的使用。通过本文的阅读,读者可以了解到DataSet对象在C#中的重要性和使用方法。 ... [详细]
  • CentOS 7部署KVM虚拟化环境之一架构介绍
    本文介绍了CentOS 7部署KVM虚拟化环境的架构,详细解释了虚拟化技术的概念和原理,包括全虚拟化和半虚拟化。同时介绍了虚拟机的概念和虚拟化软件的作用。 ... [详细]
  • 一句话解决高并发的核心原则
    本文介绍了解决高并发的核心原则,即将用户访问请求尽量往前推,避免访问CDN、静态服务器、动态服务器、数据库和存储,从而实现高性能、高并发、高可扩展的网站架构。同时提到了Google的成功案例,以及适用于千万级别PV站和亿级PV网站的架构层次。 ... [详细]
  • {moduleinfo:{card_count:[{count_phone:1,count:1}],search_count:[{count_phone:4 ... [详细]
  • 极客星球|Clickhouse在数据智能公司的应用与实践
    MobTech在2020年开始尝试使用Clickhouse,并且具有一定的数据规模,目前线上Clickhouse集群数据 ... [详细]
  • 本文介绍了Hyperledger Fabric外部链码构建与运行的相关知识,包括在Hyperledger Fabric 2.0版本之前链码构建和运行的困难性,外部构建模式的实现原理以及外部构建和运行API的使用方法。通过本文的介绍,读者可以了解到如何利用外部构建和运行的方式来实现链码的构建和运行,并且不再受限于特定的语言和部署环境。 ... [详细]
  • 图解redis的持久化存储机制RDB和AOF的原理和优缺点
    本文通过图解的方式介绍了redis的持久化存储机制RDB和AOF的原理和优缺点。RDB是将redis内存中的数据保存为快照文件,恢复速度较快但不支持拉链式快照。AOF是将操作日志保存到磁盘,实时存储数据但恢复速度较慢。文章详细分析了两种机制的优缺点,帮助读者更好地理解redis的持久化存储策略。 ... [详细]
  • 本文介绍了通过ABAP开发往外网发邮件的需求,并提供了配置和代码整理的资料。其中包括了配置SAP邮件服务器的步骤和ABAP写发送邮件代码的过程。通过RZ10配置参数和icm/server_port_1的设定,可以实现向Sap User和外部邮件发送邮件的功能。希望对需要的开发人员有帮助。摘要长度:184字。 ... [详细]
  • 本文介绍了在Windows环境下如何配置php+apache环境,包括下载php7和apache2.4、安装vc2015运行时环境、启动php7和apache2.4等步骤。希望对需要搭建php7环境的读者有一定的参考价值。摘要长度为169字。 ... [详细]
  • 合并列值-合并为一列问题需求:createtabletab(Aint,Bint,Cint)inserttabselect1,2,3unionallsel ... [详细]
  • 2018年数字化转型调查
    PointSource发布了2018年数字化转型调查,主要发现包括:1、由于缺乏战略,企业迫切需要进行数字化转型。2、企业急于开始数字化转型过程,但他们缺乏进行智能投资的战 ... [详细]
author-avatar
哪来的咸鱼
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有