热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

数据可视化之美—BI(BI数据可视化工具应该如何选择)

本文主要介绍关于的知识点,对【数据可视化之美—BI】和【BI数据可视化工具应该如何选择】有兴趣的朋友可以看下由【杏仁技术站】投稿的技术文章,希望该技术和经验能帮到你解决你所遇的【】相关技术问题。BI

本文主要介绍关于的知识点,对【数据可视化之美—BI】和【BI数据可视化工具应该如何选择】有兴趣的朋友可以看下由【杏仁技术站】投稿的技术文章,希望该技术和经验能帮到你解决你所遇的【】相关技术问题。

BI数据可视化工具应该如何选择

作者 | 李谦恒

数据工程师。逻辑重于代码,高效胜过勤奋。崇尚life work balance。


1、引言

本文主要面向对象是,对 BI 完全不了解,或只是初步了解的人。

从宏观角度介绍了 BI 的基本信息,并附以大量的图表作为说明。期望能帮助大家对BI有更深层次的理解。

如有不同见解,也欢迎在评论补充。

至于 BI 中更深层次的东西,笔者将会在未来逐一进行介绍。

2、什么是 BI?

首先引用百度百科的定义:

商业智能(Business Intelligence,简称:BI),又称商业智慧或商务智能,指用现代数据仓库技术线上分析处理技术数据挖掘数据展现技术进行数据分析以实现商业价值

通俗一些的解释:

BI 并不仅仅只是一个分析软件,而是一套完整的数据分析解决方案:它将不同数据源(如 ERP、CRM、OA、HIS、EXC 等数据文件)的数据,在整合清洗——保证数据准确性后,进行针对性的数据分析和处理,最终为企业提供报表展现与可视化图表分析,从而为企业提供决策支持

在数据化建设较差的公司,也会将?数据可视化与 BI 直接划上等号。

以下是一些经典的 BI 展示:

不得不承认,BI 给人的第一印象,的确是漂亮的图表。

在实际开发中,整合数据源、清理数据等步骤往往并非由 BI 进行处理,具体分工见下图:

正如上图所示,BI 往往与数据仓库技术、olap?引擎有着直接的上下游关系。其中数据仓库主要起到统一数据源、保证数据准确度的作用;而 OLAP 引擎则帮助 BI 加速查询。它们组合在一起,最终使用户获得良好的数据分析体验。

3、BI 能做什么

BI 对企业的作用是通过两方面实现的,业务方面和技术方面。

3.1 业务方面

数据呈现

我们可以通过 BI 直观、全面的展现企业日常业务的情况;无论是从整个集团的视角出发、还是从业务线或者部门的角度出发。

下图即为一个标准的 数据呈现(大屏)BI。决策层可以通过该图表快速、直观的了解到目前公司的会员数量和相关的销售额——这也往往是决策层最关心的两个指标

为了保证数据更新的实时性和展示的美观性,纯粹的数据呈现往往并不支持联动、下钻、上卷等 BI 常见操作。

联动、下钻、上卷都是 BI 的专业术语,未来会逐一介绍。

异常监测

专业的业务人员会有一些核心指标来监控业务,我们完全可以将其通过 BI 实行可视化监控;

下图即为 某在线教育对每日课程销量的监测,运营人员通过 BI 可以迅速发觉异常变化,从而及时作出调整。

智能预测

在大数据的基础上,BI 也能基于简单的统计学,提供一些拟合线,来帮助业务人员进行相关分析。

下图即 对某超市销售额进行预测。

特定建模分析

特定的建模分析通常是由精通业务的业务人员提出,通过合理的建模找出业务中可能存在的问题,将其反映出来并最终回归到业务,形成闭环决策并不断优化的一个过程。

业务建模可简单,可由一个或多个图表组成,也可复杂,通过一组或多组数据图表支撑。

如下图,即为对客户销售额建立的模型。通过该模型,业务人员能够快捷的了解到目前 CRM 的客户情况。

帮助业务进行快速智能分析

尽管 BI 能满足大部分常见需求,但资深的业务人员总会有一些突如其来的灵感。这种灵感稍纵即逝,如果等到数据部门提供数据再进行分析——可能为时已晚。如果有BI的话,业务人员可以立刻基于业务数据进行灵活分析,从而验证想法。

3.2 技术层面

减少人工处理,提升工作效率

某些指标对每家公司都是非常重要的,无论该公司是否存在 BI、数据部门。

例如 毛利、成本、客户。

在没有 BI 的情况下,如果公司想要收集汇总这些指标信息,大多数时候都需要业务人员手动从各个系统提取数据,然后在 exc 上汇总——这个过程无疑是冗长、枯燥且毫无价值的。同时,还容易产生以下问题:

如果有了 BI 和对应的数据底层,就可以自动化生成相关报表。

智能报表 也属于广义上的 BI

数据准确性无法保证:手工计算,就有可能出错。无法避免

数据及时性无法保证:手工计算的效率由使用者决定,无法控制

修改复杂:任何业务的新增、修改。都需要对复杂的 exc 公式进行修改。

结果倒逼,统一指标口径

成熟的公司必然有一套统一的指标口径;但在其野蛮生长中,指标、维度可能会缺乏统筹规划,从而产生一些遗留问题。

举个例子:库存、销售、运营口中的"销售额"往往不是同一个"销售额"。

最常见的口径不一致问题,就是时间口径不同;销售额可以依照 下单时间,支付时间,发货时间,收货时间,完成订单时间 等不同角度进行分析。在没有统一口径的情况下必然会出现误解。

BI 的使用者必然包括决策层。因此,指标必然会以决策层认可的口径为主,从而消除争议。

整合信息孤岛,统一分析平台

数据仓库是每家公司都应有的东西,但实际上大部分公司并不完善;但分析、统计的需求并不会因为没有数仓而停滞。这个时候,BI 就可以启动汇总数据源进行统一分析的效果

并不推荐长久使用 BI 作为数据汇总层。

3.3 总结:

正如上述描述,BI 更多的是从业务方出发,帮助业务解决问题。它将繁杂的数据库底层进行整理汇总,形成有效的指标维度,让 BI 使用者可以直观、清楚地看到他所关注的数据,从而帮助整个企业更好的发展。在数据的自由探索中找到原因,避免“拍脑袋”式的决策。这就是 BI 的作用,而非仅仅的数据报表呈现。

4、BI 的应用场景

BI 应用场景广泛,以下逐一枚举。

大屏

大屏就是我们在 街头、展览会上常见的超大屏幕,其上大多充满了含义不明的图表。举几个例子

大屏的最大特点 就是。据笔者观察,其上的数据大多都是“虚荣指标”——除了好看外一无是处。但换个角度,对外宣传时,需要的就是好看。

设想一下,假设超市、医院、 会议室能有一个大屏。会吸引多少目光的注意力;增加多少回头客。

大屏的开发,有以下几点需要注意:

因为展示效果等问题,大屏相比其他 BI,缺少交互性,无法进行联动、钻取等操作。

硬件成本较高——大屏很贵

BI 开发成本较高——需根据硬件实际大小进行反复调试,才能保证最终结果的展示。

数据 要求较高——主要是指数据的实时性;

驾驶舱

BI 驾驶舱是一个核心指标汇总系统,将公司的核心指标进行可视化展示,帮助决策层能通过1图直接了解到整个企业的运营情况,也可以下钻到各个细分业务中了解详细数据。

因为面向对象主要为企业高层,因此驾驶舱的数据准确度美观度一般都是最高的。相对而言,开发成本也是最高的;

相比大屏来说,驾驶舱可以自由下钻到任意主题的详细看板中。分析性更强

驾驶舱则要注意这些:

数据准确性非常高——它不像大屏,错了也没有人知道。驾驶舱对接公司决策层,不允许有任何的数据误差。

美观度——领导要看的东西,你自然要花点功夫去精心调试。

看板

看板(dashborad)即为最基础的 BI 展现方式。

相比 大屏、驾驶舱而言,dashboard 并不那么浮夸,它的主要使用对象为一般的管理人员和运营人员。一般来说,看板也可以自由的钻取、联动。从而帮助业务人员进行更好的分析。

移动端

部分 BI 产品也支持移动端展示,内容一般为核心指标。

移动端开发时,需要特别注意不同手机的适配度。必要情况下,可以拿用户的实际手机款式做针对性调整。

自助分析

并非所有的仪表板,都一定由数据部门来开发完成。有能力的业务人员更希望自己可以随时进行制作,而不受数据部门的约束。因此在数据部门提供数据底层的情况时,业务部门也会亲自上阵进行开发。

5、BI 的开发方式

BI 的开发,与常见的项目开发并无两样

确认需求——需求分析——指标维度梳理——源数据和数据质量确认——结果表设计——ETL 开发——可视化实现

有几个重点需要注意:

第一步要确定 BI 的最终使用者,直接与使用者沟通会节省大量的时间。

需求分析结束后,一定要与最终使用者进行文档确认,确保双方理解一致

不要轻易相信源头提供的数据,获取到数据后自己一定要初步检查,确保数据质量

demo 先行——尽早确定使用者想要的BI样式,免得反复调试浪费时间。

6、部分BI介绍 6.1 Tableau

Tableau 毫无疑问的市场王者,也是目前全球最易于上手的报表分析工具,并且具备强大的统计分析扩展功能。它能够根据用户的业务需求对报表进行迁移和开发,实现业务分析人员独立自助、简单快速、以界面拖拽式的操作方式对业务数据进行联机分析处理、即时查询等功能。

但 Tabealu 也有自己的缺点:最大的缺点就是价格过于昂贵。对于大部分公司来说,如此昂贵的 Tableau 性价比并不高。

6.2 FineReport

帆软是目前国内最大的 BI 厂商,合作厂商也相当多;产品线也遍及大屏、移动端、智能报表。可以说是最适合中国中小型企业的 BI 了。

FineReport 本是一个智能报表软件,但由于集成了大量图表,相比其他 BI 开发效率虽然稍慢,但是自由度更高。

6.3 Superset

Superset 是一款由 Airbnb?开源的“现代化的企业级 BI (商业智能) Web 应用程序”,其通过创建和分享 dashboard,为数据分析提供了轻量级的数据查询和可视化方案。

Superset 的缺点就比较多了

没有提供图表的下钻功能

不支持多图表间的复杂联动

处理大数据集时容易暴毙

权限管理和图表管理的功能设计基本为0

但它是开源的——你无法要求一个东西又免费又好用,因此技术能力较强的公司可以考虑。

7、其他杂谈

正如开题所言, BI 并非简单的数据可视化,而是一套极度复杂的商业解决方案;

如何做到企业数据化?数据驱动业务?数据治理?

仅凭几个EXC是远远不能满足的——只有建立起良好的 BI 生态体系,企业才能真正迈入数据化。

另一方面,BI 的表象是可视化分析报表的呈现,但它的本质还是业务问题、管理问题。

如何通过 BI ,使得业务、管理能够不断优化,这才是值得我们深度思考的。

全文完


以下文章您可能也会感兴趣:

缓存的那些事

Java 并发编程 -- 线程池源码实战

Lombok Builder 构建器做了哪些事情?

WePY 2.0 新特性

SSL证书的自动化管理

聊聊移动端跨平台数据库 Realm

苹果在医疗健康领域的三个 Kit

响应式编程(下):Spring 5

响应式编程(上):总览

Web 与 App? 数据交互原理和实现

我们正在招聘 Java 工程师,欢迎有兴趣的同学投递简历到 rd-hr@xingren.com 。

本文《数据可视化之美—BI》版权归杏仁技术站所有,引用数据可视化之美—BI需遵循CC 4.0 BY-SA版权协议。


推荐阅读
  • 篇首语:本文由编程笔记#小编为大家整理,主要介绍了软件测试知识点之数据库压力测试方法小结相关的知识,希望对你有一定的参考价值。 ... [详细]
  • 知识图谱——机器大脑中的知识库
    本文介绍了知识图谱在机器大脑中的应用,以及搜索引擎在知识图谱方面的发展。以谷歌知识图谱为例,说明了知识图谱的智能化特点。通过搜索引擎用户可以获取更加智能化的答案,如搜索关键词"Marie Curie",会得到居里夫人的详细信息以及与之相关的历史人物。知识图谱的出现引起了搜索引擎行业的变革,不仅美国的微软必应,中国的百度、搜狗等搜索引擎公司也纷纷推出了自己的知识图谱。 ... [详细]
  • PHP图片截取方法及应用实例
    本文介绍了使用PHP动态切割JPEG图片的方法,并提供了应用实例,包括截取视频图、提取文章内容中的图片地址、裁切图片等问题。详细介绍了相关的PHP函数和参数的使用,以及图片切割的具体步骤。同时,还提供了一些注意事项和优化建议。通过本文的学习,读者可以掌握PHP图片截取的技巧,实现自己的需求。 ... [详细]
  • 本文介绍了如何使用php限制数据库插入的条数并显示每次插入数据库之间的数据数目,以及避免重复提交的方法。同时还介绍了如何限制某一个数据库用户的并发连接数,以及设置数据库的连接数和连接超时时间的方法。最后提供了一些关于浏览器在线用户数和数据库连接数量比例的参考值。 ... [详细]
  • 如何用UE4制作2D游戏文档——计算篇
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了如何用UE4制作2D游戏文档——计算篇相关的知识,希望对你有一定的参考价值。 ... [详细]
  • eclipse学习(第三章:ssh中的Hibernate)——11.Hibernate的缓存(2级缓存,get和load)
    本文介绍了eclipse学习中的第三章内容,主要讲解了ssh中的Hibernate的缓存,包括2级缓存和get方法、load方法的区别。文章还涉及了项目实践和相关知识点的讲解。 ... [详细]
  • Tomcat/Jetty为何选择扩展线程池而不是使用JDK原生线程池?
    本文探讨了Tomcat和Jetty选择扩展线程池而不是使用JDK原生线程池的原因。通过比较IO密集型任务和CPU密集型任务的特点,解释了为何Tomcat和Jetty需要扩展线程池来提高并发度和任务处理速度。同时,介绍了JDK原生线程池的工作流程。 ... [详细]
  • 本文介绍了在Oracle数据库中创建序列时如何选择cache或nocache参数。cache参数可以提高序列的存取速度,但可能会导致序列丢失;nocache参数可以避免序列丢失,但在高并发访问时可能导致性能问题。文章详细解释了两者的区别和使用场景。 ... [详细]
  • 本文介绍了Windows操作系统的版本及其特点,包括Windows 7系统的6个版本:Starter、Home Basic、Home Premium、Professional、Enterprise、Ultimate。Windows操作系统是微软公司研发的一套操作系统,具有人机操作性优异、支持的应用软件较多、对硬件支持良好等优点。Windows 7 Starter是功能最少的版本,缺乏Aero特效功能,没有64位支持,最初设计不能同时运行三个以上应用程序。 ... [详细]
  • 一句话解决高并发的核心原则
    本文介绍了解决高并发的核心原则,即将用户访问请求尽量往前推,避免访问CDN、静态服务器、动态服务器、数据库和存储,从而实现高性能、高并发、高可扩展的网站架构。同时提到了Google的成功案例,以及适用于千万级别PV站和亿级PV网站的架构层次。 ... [详细]
  • 分享css中提升优先级属性!important的用法总结
    web前端|css教程css!importantweb前端-css教程本文分享css中提升优先级属性!important的用法总结微信门店展示源码,vscode如何管理站点,ubu ... [详细]
  • 上图是InnoDB存储引擎的结构。1、缓冲池InnoDB存储引擎是基于磁盘存储的,并将其中的记录按照页的方式进行管理。因此可以看作是基于磁盘的数据库系统。在数据库系统中,由于CPU速度 ... [详细]
  • 代理模式的详细介绍及应用场景
    代理模式是一种在软件开发中常用的设计模式,通过在客户端和目标对象之间增加一层中间层,让代理对象代替目标对象进行访问,从而简化系统的复杂性。代理模式可以根据不同的使用目的分为远程代理、虚拟代理、Copy-on-Write代理、保护代理、防火墙代理、智能引用代理和Cache代理等几种。本文将详细介绍代理模式的原理和应用场景。 ... [详细]
  • 本文介绍了如何使用PHP向系统日历中添加事件的方法,通过使用PHP技术可以实现自动添加事件的功能,从而实现全局通知系统和迅速记录工具的自动化。同时还提到了系统exchange自带的日历具有同步感的特点,以及使用web技术实现自动添加事件的优势。 ... [详细]
  • 本文介绍了Java工具类库Hutool,该工具包封装了对文件、流、加密解密、转码、正则、线程、XML等JDK方法的封装,并提供了各种Util工具类。同时,还介绍了Hutool的组件,包括动态代理、布隆过滤、缓存、定时任务等功能。该工具包可以简化Java代码,提高开发效率。 ... [详细]
author-avatar
_名花侑主
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有