热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

数据可视化之美—BI(BI数据可视化工具应该如何选择)

本文主要介绍关于的知识点,对【数据可视化之美—BI】和【BI数据可视化工具应该如何选择】有兴趣的朋友可以看下由【杏仁技术站】投稿的技术文章,希望该技术和经验能帮到你解决你所遇的【】相关技术问题。BI

本文主要介绍关于的知识点,对【数据可视化之美—BI】和【BI数据可视化工具应该如何选择】有兴趣的朋友可以看下由【杏仁技术站】投稿的技术文章,希望该技术和经验能帮到你解决你所遇的【】相关技术问题。

BI数据可视化工具应该如何选择

作者 | 李谦恒

数据工程师。逻辑重于代码,高效胜过勤奋。崇尚life work balance。


1、引言

本文主要面向对象是,对 BI 完全不了解,或只是初步了解的人。

从宏观角度介绍了 BI 的基本信息,并附以大量的图表作为说明。期望能帮助大家对BI有更深层次的理解。

如有不同见解,也欢迎在评论补充。

至于 BI 中更深层次的东西,笔者将会在未来逐一进行介绍。

2、什么是 BI?

首先引用百度百科的定义:

商业智能(Business Intelligence,简称:BI),又称商业智慧或商务智能,指用现代数据仓库技术线上分析处理技术数据挖掘数据展现技术进行数据分析以实现商业价值

通俗一些的解释:

BI 并不仅仅只是一个分析软件,而是一套完整的数据分析解决方案:它将不同数据源(如 ERP、CRM、OA、HIS、EXC 等数据文件)的数据,在整合清洗——保证数据准确性后,进行针对性的数据分析和处理,最终为企业提供报表展现与可视化图表分析,从而为企业提供决策支持

在数据化建设较差的公司,也会将?数据可视化与 BI 直接划上等号。

以下是一些经典的 BI 展示:

不得不承认,BI 给人的第一印象,的确是漂亮的图表。

在实际开发中,整合数据源、清理数据等步骤往往并非由 BI 进行处理,具体分工见下图:

正如上图所示,BI 往往与数据仓库技术、olap?引擎有着直接的上下游关系。其中数据仓库主要起到统一数据源、保证数据准确度的作用;而 OLAP 引擎则帮助 BI 加速查询。它们组合在一起,最终使用户获得良好的数据分析体验。

3、BI 能做什么

BI 对企业的作用是通过两方面实现的,业务方面和技术方面。

3.1 业务方面

数据呈现

我们可以通过 BI 直观、全面的展现企业日常业务的情况;无论是从整个集团的视角出发、还是从业务线或者部门的角度出发。

下图即为一个标准的 数据呈现(大屏)BI。决策层可以通过该图表快速、直观的了解到目前公司的会员数量和相关的销售额——这也往往是决策层最关心的两个指标

为了保证数据更新的实时性和展示的美观性,纯粹的数据呈现往往并不支持联动、下钻、上卷等 BI 常见操作。

联动、下钻、上卷都是 BI 的专业术语,未来会逐一介绍。

异常监测

专业的业务人员会有一些核心指标来监控业务,我们完全可以将其通过 BI 实行可视化监控;

下图即为 某在线教育对每日课程销量的监测,运营人员通过 BI 可以迅速发觉异常变化,从而及时作出调整。

智能预测

在大数据的基础上,BI 也能基于简单的统计学,提供一些拟合线,来帮助业务人员进行相关分析。

下图即 对某超市销售额进行预测。

特定建模分析

特定的建模分析通常是由精通业务的业务人员提出,通过合理的建模找出业务中可能存在的问题,将其反映出来并最终回归到业务,形成闭环决策并不断优化的一个过程。

业务建模可简单,可由一个或多个图表组成,也可复杂,通过一组或多组数据图表支撑。

如下图,即为对客户销售额建立的模型。通过该模型,业务人员能够快捷的了解到目前 CRM 的客户情况。

帮助业务进行快速智能分析

尽管 BI 能满足大部分常见需求,但资深的业务人员总会有一些突如其来的灵感。这种灵感稍纵即逝,如果等到数据部门提供数据再进行分析——可能为时已晚。如果有BI的话,业务人员可以立刻基于业务数据进行灵活分析,从而验证想法。

3.2 技术层面

减少人工处理,提升工作效率

某些指标对每家公司都是非常重要的,无论该公司是否存在 BI、数据部门。

例如 毛利、成本、客户。

在没有 BI 的情况下,如果公司想要收集汇总这些指标信息,大多数时候都需要业务人员手动从各个系统提取数据,然后在 exc 上汇总——这个过程无疑是冗长、枯燥且毫无价值的。同时,还容易产生以下问题:

如果有了 BI 和对应的数据底层,就可以自动化生成相关报表。

智能报表 也属于广义上的 BI

数据准确性无法保证:手工计算,就有可能出错。无法避免

数据及时性无法保证:手工计算的效率由使用者决定,无法控制

修改复杂:任何业务的新增、修改。都需要对复杂的 exc 公式进行修改。

结果倒逼,统一指标口径

成熟的公司必然有一套统一的指标口径;但在其野蛮生长中,指标、维度可能会缺乏统筹规划,从而产生一些遗留问题。

举个例子:库存、销售、运营口中的"销售额"往往不是同一个"销售额"。

最常见的口径不一致问题,就是时间口径不同;销售额可以依照 下单时间,支付时间,发货时间,收货时间,完成订单时间 等不同角度进行分析。在没有统一口径的情况下必然会出现误解。

BI 的使用者必然包括决策层。因此,指标必然会以决策层认可的口径为主,从而消除争议。

整合信息孤岛,统一分析平台

数据仓库是每家公司都应有的东西,但实际上大部分公司并不完善;但分析、统计的需求并不会因为没有数仓而停滞。这个时候,BI 就可以启动汇总数据源进行统一分析的效果

并不推荐长久使用 BI 作为数据汇总层。

3.3 总结:

正如上述描述,BI 更多的是从业务方出发,帮助业务解决问题。它将繁杂的数据库底层进行整理汇总,形成有效的指标维度,让 BI 使用者可以直观、清楚地看到他所关注的数据,从而帮助整个企业更好的发展。在数据的自由探索中找到原因,避免“拍脑袋”式的决策。这就是 BI 的作用,而非仅仅的数据报表呈现。

4、BI 的应用场景

BI 应用场景广泛,以下逐一枚举。

大屏

大屏就是我们在 街头、展览会上常见的超大屏幕,其上大多充满了含义不明的图表。举几个例子

大屏的最大特点 就是。据笔者观察,其上的数据大多都是“虚荣指标”——除了好看外一无是处。但换个角度,对外宣传时,需要的就是好看。

设想一下,假设超市、医院、 会议室能有一个大屏。会吸引多少目光的注意力;增加多少回头客。

大屏的开发,有以下几点需要注意:

因为展示效果等问题,大屏相比其他 BI,缺少交互性,无法进行联动、钻取等操作。

硬件成本较高——大屏很贵

BI 开发成本较高——需根据硬件实际大小进行反复调试,才能保证最终结果的展示。

数据 要求较高——主要是指数据的实时性;

驾驶舱

BI 驾驶舱是一个核心指标汇总系统,将公司的核心指标进行可视化展示,帮助决策层能通过1图直接了解到整个企业的运营情况,也可以下钻到各个细分业务中了解详细数据。

因为面向对象主要为企业高层,因此驾驶舱的数据准确度美观度一般都是最高的。相对而言,开发成本也是最高的;

相比大屏来说,驾驶舱可以自由下钻到任意主题的详细看板中。分析性更强

驾驶舱则要注意这些:

数据准确性非常高——它不像大屏,错了也没有人知道。驾驶舱对接公司决策层,不允许有任何的数据误差。

美观度——领导要看的东西,你自然要花点功夫去精心调试。

看板

看板(dashborad)即为最基础的 BI 展现方式。

相比 大屏、驾驶舱而言,dashboard 并不那么浮夸,它的主要使用对象为一般的管理人员和运营人员。一般来说,看板也可以自由的钻取、联动。从而帮助业务人员进行更好的分析。

移动端

部分 BI 产品也支持移动端展示,内容一般为核心指标。

移动端开发时,需要特别注意不同手机的适配度。必要情况下,可以拿用户的实际手机款式做针对性调整。

自助分析

并非所有的仪表板,都一定由数据部门来开发完成。有能力的业务人员更希望自己可以随时进行制作,而不受数据部门的约束。因此在数据部门提供数据底层的情况时,业务部门也会亲自上阵进行开发。

5、BI 的开发方式

BI 的开发,与常见的项目开发并无两样

确认需求——需求分析——指标维度梳理——源数据和数据质量确认——结果表设计——ETL 开发——可视化实现

有几个重点需要注意:

第一步要确定 BI 的最终使用者,直接与使用者沟通会节省大量的时间。

需求分析结束后,一定要与最终使用者进行文档确认,确保双方理解一致

不要轻易相信源头提供的数据,获取到数据后自己一定要初步检查,确保数据质量

demo 先行——尽早确定使用者想要的BI样式,免得反复调试浪费时间。

6、部分BI介绍 6.1 Tableau

Tableau 毫无疑问的市场王者,也是目前全球最易于上手的报表分析工具,并且具备强大的统计分析扩展功能。它能够根据用户的业务需求对报表进行迁移和开发,实现业务分析人员独立自助、简单快速、以界面拖拽式的操作方式对业务数据进行联机分析处理、即时查询等功能。

但 Tabealu 也有自己的缺点:最大的缺点就是价格过于昂贵。对于大部分公司来说,如此昂贵的 Tableau 性价比并不高。

6.2 FineReport

帆软是目前国内最大的 BI 厂商,合作厂商也相当多;产品线也遍及大屏、移动端、智能报表。可以说是最适合中国中小型企业的 BI 了。

FineReport 本是一个智能报表软件,但由于集成了大量图表,相比其他 BI 开发效率虽然稍慢,但是自由度更高。

6.3 Superset

Superset 是一款由 Airbnb?开源的“现代化的企业级 BI (商业智能) Web 应用程序”,其通过创建和分享 dashboard,为数据分析提供了轻量级的数据查询和可视化方案。

Superset 的缺点就比较多了

没有提供图表的下钻功能

不支持多图表间的复杂联动

处理大数据集时容易暴毙

权限管理和图表管理的功能设计基本为0

但它是开源的——你无法要求一个东西又免费又好用,因此技术能力较强的公司可以考虑。

7、其他杂谈

正如开题所言, BI 并非简单的数据可视化,而是一套极度复杂的商业解决方案;

如何做到企业数据化?数据驱动业务?数据治理?

仅凭几个EXC是远远不能满足的——只有建立起良好的 BI 生态体系,企业才能真正迈入数据化。

另一方面,BI 的表象是可视化分析报表的呈现,但它的本质还是业务问题、管理问题。

如何通过 BI ,使得业务、管理能够不断优化,这才是值得我们深度思考的。

全文完


以下文章您可能也会感兴趣:

缓存的那些事

Java 并发编程 -- 线程池源码实战

Lombok Builder 构建器做了哪些事情?

WePY 2.0 新特性

SSL证书的自动化管理

聊聊移动端跨平台数据库 Realm

苹果在医疗健康领域的三个 Kit

响应式编程(下):Spring 5

响应式编程(上):总览

Web 与 App? 数据交互原理和实现

我们正在招聘 Java 工程师,欢迎有兴趣的同学投递简历到 rd-hr@xingren.com 。

本文《数据可视化之美—BI》版权归杏仁技术站所有,引用数据可视化之美—BI需遵循CC 4.0 BY-SA版权协议。


推荐阅读
  • 本文总结了 Apache Shiro 安全框架的学习体会,并通过具体应用实例进行了详细分析。Apache Shiro 是一个强大且灵活的安全框架,适用于各种应用程序的安全需求。通过对该框架的核心功能和使用方法的深入探讨,本文不仅帮助读者理解其基本概念和架构设计,还提供了实际项目中的应用示例,以便更好地掌握和运用这一工具。特别感谢开涛的博客文章,为本文提供了宝贵的参考和启发。 ... [详细]
  • Nginx入门指南:从零开始掌握基础配置与优化技巧
    Nginx入门指南:从零开始掌握基础配置与优化技巧 ... [详细]
  • 作为140字符的开创者,Twitter看似简单却异常复杂。其简洁之处在于仅用140个字符就能实现信息的高效传播,甚至在多次全球性事件中超越传统媒体的速度。然而,为了支持2亿用户的高效使用,其背后的技术架构和系统设计则极为复杂,涉及高并发处理、数据存储和实时传输等多个技术挑战。 ... [详细]
  • ylbtech-进销存管理解决方案:进销存管理,即购销链管理,涵盖企业从采购(进)、库存(存)到销售(销)的全流程动态管控。其中,“进”涉及从市场询价、供应商选择、采购执行直至货物入库及支付流程;“销”则包括产品定价、客户报价、订单处理及销售出库等环节。该解决方案旨在通过信息化手段,提升企业运营效率,优化库存结构,增强市场响应速度。 ... [详细]
  • Java中高级工程师面试必备:JVM核心知识点全面解析
    对于软件开发人员而言,随着技术框架的不断演进和成熟,许多高级功能已经被高度封装,使得初级开发者只需掌握基本用法即可迅速完成项目。然而,对于中高级工程师而言,深入了解Java虚拟机(JVM)的核心知识点是必不可少的。这不仅有助于优化性能和解决复杂问题,还能在面试中脱颖而出。本文将全面解析JVM的关键概念和技术细节,帮助读者全面提升技术水平。 ... [详细]
  • 全面解析Java虚拟机:内存模型深度剖析 ... [详细]
  • MySQL性能优化与调参指南【数据库管理】
    本文详细探讨了MySQL数据库的性能优化与参数调整技巧,旨在帮助数据库管理员和开发人员提升系统的运行效率。内容涵盖索引优化、查询优化、配置参数调整等方面,结合实际案例进行深入分析,提供实用的操作建议。此外,还介绍了常见的性能监控工具和方法,助力读者全面掌握MySQL性能优化的核心技能。 ... [详细]
  • 获取贵州省毕节市高分辨率谷歌卫星影像图
    毕节市,作为贵州省西北部的重要地级市,地处乌蒙山脉核心区域,是连接四川、云南和贵州三省的关键节点。本研究旨在获取该地区的高分辨率谷歌卫星影像图,以全面展示其独特的地理特征和城市布局。通过这些高清影像,研究人员能够更深入地分析毕节市的自然环境、城市规划及发展状况。 ... [详细]
  • 修复一个 Bug 竟耗时两天?真的有那么复杂吗?
    修复一个 Bug 竟然耗费了两天时间?这背后究竟隐藏着怎样的复杂性?本文将深入探讨这个看似简单的 Bug 为何会如此棘手,从代码层面剖析问题根源,并分享解决过程中遇到的技术挑战和心得。 ... [详细]
  • 使用Boost.Asio进行异步数据处理的应用程序主要依赖于两个核心概念:I/O服务和I/O对象。I/O服务抽象了操作系统接口,使得异步操作能够高效地执行。I/O对象则代表了具体的网络资源,如套接字和文件描述符,通过这些对象可以实现数据的读写操作。本文详细介绍了这两个概念在Boost.Asio中的应用及其在网络编程中的重要性。 ... [详细]
  • NoSQL数据库,即非关系型数据库,有时也被称作Not Only SQL,是一种区别于传统关系型数据库的管理系统。这类数据库设计用于处理大规模、高并发的数据存储与查询需求,特别适用于需要快速读写大量非结构化或半结构化数据的应用场景。NoSQL数据库通过牺牲部分一致性来换取更高的可扩展性和性能,支持分布式部署,能够有效应对互联网时代的海量数据挑战。 ... [详细]
  • IIS 7及7.5版本中应用程序池的最佳配置策略与实践
    在IIS 7及7.5版本中,优化应用程序池的配置是提升Web站点性能的关键步骤。具体操作包括:首先定位到目标Web站点的应用程序池,然后通过“应用程序池”菜单找到对应的池,右键选择“高级设置”。在一般优化方案中,建议调整以下几个关键参数:1. **基本设置**: - **队列长度**:默认值为1000,可根据实际需求调整队列长度,以提高处理请求的能力。此外,还可以进一步优化其他参数,如处理器使用限制、回收策略等,以确保应用程序池的高效运行。这些优化措施有助于提升系统的稳定性和响应速度。 ... [详细]
  • 开发笔记:校园商铺系统中店铺注册功能模块的Controller层优化与重构
    开发笔记:校园商铺系统中店铺注册功能模块的Controller层优化与重构 ... [详细]
  • Cookie是一种小型数据文件,由Web服务器生成并存储在用户的浏览器中。当用户再次访问同一服务器时,这些数据可以被重新读取,为用户提供个性化的体验。Cookie在软件测试中具有重要作用,能够帮助测试人员验证会话管理、用户偏好设置等功能的正确性和安全性。通过深入解析Cookie的工作原理及其在不同场景下的应用,本文旨在为软件测试人员提供全面的技术指导。 ... [详细]
  • 随着各类门户网站、短视频平台、剧集播放和在线教育等互联网内容生态的迅猛发展,网络流量呈现爆炸性增长。为提升用户体验,边缘云计算与CDN(内容分发网络)技术应运而生。这些技术通过在靠近用户的位置部署节点,有效降低了数据传输延迟,提高了内容加载速度,确保用户能够通过手机或电脑流畅访问互联网资源。此外,边缘计算还能够在本地处理部分数据,进一步减轻核心网络的压力,优化整体网络性能。 ... [详细]
author-avatar
_名花侑主
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有