热门标签 | HotTags
当前位置:  开发笔记 > 数据库 > 正文

一文搞懂数据异常问题该如何分析

“上一篇文章给大家介绍了如何巧解费米问题,这篇文章将给大家带来另外一类高频考题——业务分析题,主要以“销售收入下降了该如何分析”这个

 上一篇文章给大家介绍了如何巧解费米问题,这篇文章将给大家带来另外一类高频考题——业务分析题,主要以“销售收入下降了该如何分析”这个问题为主线进行分析



01

数据异常波动的表现形式


数据异常监控分析不仅是数据分析面试中的高频考题,同时也是业务分析中一项常态化的工作内容。当我们面对市场、产品、运营等各种业务场景,经常会发现很多异常数据的问题,比如:
  1. 某APP日活DAU相比昨日突然下降了10%,该如何分析?
  2. 某公司销售收入环比上月下降了15%,该如何分析?
  3. 某产品客单价环比上月下降了20%,该如何分析?
  4. ……


上述各种业务场景,其实都是发现了数据有异常波动的情况,那接下来问题来了,我们该如何着手进行分析呢?

大部分人解决问题的思路,都是直奔主题找原因,上来就去找出现异常的原因、异常点在哪里。其实这种分析思路有一个最大的弊端就是不够体系化,往往能够找到一些原因,但是很可能是片面的,甚至可能还会踩雷。接下来就给大家分享一种比较实用的方法,我个人称之为“点 - 线 - 面”分析法。



02

数据异常分析的方法论



点:首先排查数据准确性,确定是否属于数据错误。容易出现数据错误的环节有数据采集环节(埋点)、数据提取环节、产品环节(BUG)、业务环节(数据口径)等。如果没有问题进入下一步分析;


线:拉长时间周期,也就是进行纵向分析,看是否属于周期性波动,有些行业受季节或淡旺季影响较大,比如家电、饮料、在线教育等都受淡旺季影响较大。如果没有问题进入下一步分析


面:首先,综合运用公式拆解法、多维度拆解法等对大问题进行拆解,拆解为一个个可着手分析的小问题;然后,通过计算影响系数初步定位到主要影响原因;最后,大胆假设,小心验证,通过假设检验法逐步排查到产生问题的根本原因。

比如,我们以销售收入下降为例,通过点 - 线 - 面”分析中的点 - 线分析确认属于数据异常后,接下来就可以在的分析环节中采用“三部曲分析”法,主要流程如下:

1. 运用公式拆解法、多维度拆解法等对大问题进行拆解
2. 计算影响系数,定位主要原因

影响系数 = ( 细分项本月数 - 细分项上月数 ) ( 本月总量 - 上月总量 )

影响系数越大,说明该维度数据就是造成总体波动的主要影响因素。

3. 通过假设检验法逐步排查根本原因

假设在计算影响系数后,初步确定主要是新用户减少引起的收入下降,接下来就需要对新用户数下降的原因进行假设,常见的假设维度有内、外部维度,其中内部维度主要有渠道侧、产品侧、运营侧、技术侧等等,然后通过数据逐一对上述假设进行验证。

以上是几种常见的拆分维度,通过初步拆分,定位原因大致范围。


03

数据异常分析的案例实战


某连锁零售集团最近两年每月销售收入保持稳中有升的趋势,但是在2021年6月销售收入突然下降了17%(下图),这时销售负责人非常着急,让你尽快排查一下销售下跌的原因。面对收入下降这种棘手的问题,如果对于没有经验的同学,确实还是比较头疼的,就像那烫手的山芋,无从下手
接下来,我们就按照按照上面的套路来演练一下。


首先排查数据准确性,确定不属于数据错误;


线

拉长时间周期,不属于季节波动


1. 首先把总收入拆分成新、老用户收入,如下图:

通过观察数据,发现新、老用户收入均有不同程度下滑,于是启动第二步,分别计算其影响系数。

2. 计算新、老用户收入影响系数

用户收入影响系数 = (33 - 47)  (100 - 120) = 0.7

老用户收入影响系数 = (67 - 73) / (100 - 120) = 0.3

新用户收入影响系数0.7,说明总收入下降主要影响因素是新用户收入下降,明确问题的范围后接着进行细分,新用户收入的构成是什么?

新用户收入 = 新用户数量 * 转化率 * 客单价

通过调取数据分析发现,新用户转化率和客单价都保持稳定,那么问题就出在了新用户数量这个指标上,那新用户又是由什么构成呢?

新用户 = 渠道 1 + 渠道 2 + 渠道 3 + …… + 渠道 n 

于是我们把新用户按照其渠道来源进行拆分:


通过对新用户渠道来源进行拆分,我们发现渠道1在2021年6月新用户数量下降非常严重,于是我们就定位到收入下滑的根本原因在于渠道1新用户数量下滑严重。接下来我们就可以启动第三步,对渠道1新用户数量下滑原因进行假设检验。

3. 对渠道新用户数下滑原因进行假设检验

渠道流量下降可能的原因可以从两个大的维度进行考虑:对于外部维度,可以考虑外部环境变动、竞品变化等;对于内部维度,可能的原因有渠道线索问题、投放策略变化等。这个时候一方面要调取数据进行分析验证,另一方面需要联系渠道1的负责人一起定位具体原因,找到具体原因后,再对症下药。


本案例纯属虚构,如有雷同,纯属巧合。当然,实际的业务要比这复杂的多,需要考虑的因素也很多,花费的时间也会更长。但是,解决问题的方法论和流程是可复用的。相信大家以后再面对类似问题的时候,会有一个清晰的分析思路和明确的入手点。

最后,我们如果对上面的点 - 线 - 面分析法进行总结归纳的话,可以提炼为下面这张图:



希望这一篇能够对大家准备面试和实际工作有切实的帮助,如果同学觉得有帮助,欢迎点赞转发啊!大家如果有其他想法,欢迎加入我一起讨论交流。



推荐阅读
  • 企业数据应用挑战及元数据管理的重要性
    本文主要介绍了企业在日常经营管理过程中面临的数据应用挑战,包括数据找不到、数据读不懂、数据不可信等问题。针对这些挑战,通过元数据管理可以实现数据的可见、可懂、可用,帮助业务快速获取所需数据。文章提出了“灵魂”三问——元数据是什么、有什么用、又该怎么管,强调了元数据管理在企业数据治理中的基础和前提作用。 ... [详细]
  • 一、Hadoop来历Hadoop的思想来源于Google在做搜索引擎的时候出现一个很大的问题就是这么多网页我如何才能以最快的速度来搜索到,由于这个问题Google发明 ... [详细]
  • 合并列值-合并为一列问题需求:createtabletab(Aint,Bint,Cint)inserttabselect1,2,3unionallsel ... [详细]
  • 在数据分析工作中,我们通常会遇到这样的问题,一个业务部门由若干业务组构成,需要筛选出每个业务组里业绩前N名的业务员。这其实是一个分组排序的 ... [详细]
  • 本文介绍了Redis的基础数据结构string的应用场景,并以面试的形式进行问答讲解,帮助读者更好地理解和应用Redis。同时,描述了一位面试者的心理状态和面试官的行为。 ... [详细]
  • 本文介绍了新款奇骏的两个让人上瘾的功能,分别是智能互联系统和BOSE音响。通过对新款奇骏的配置和功能进行评测,探讨了这两个新增功能的使用体验和优势。此外,还介绍了新款奇骏的其他配置和改进,如增加的座椅和驾驶辅助系统,以及内饰的舒适性提升。对于喜欢音响的消费者来说,BOSE音响的升级也是一个亮点。最后,文章提到了BOSE音响的数字还原能力,以及7座版无法配备BOSE音响的原因。 ... [详细]
  • “你永远都不知道明天和‘公司的意外’哪个先来。”疫情期间,这是我们最战战兢兢的心情。但是显然,有些人体会不了。这份行业数据,让笔者“柠檬” ... [详细]
  • 数据对比分析图PPT(127.0.0.1表示什么)的使用方法和意义
    本文介绍了数据对比分析图PPT的使用方法和意义,解释了127.0.0.1的含义,并提供了相关资源下载。同时还讨论了目标管理的概念和MBO的实施方法。 ... [详细]
  • FineReport平台数据分析图表显示部分系列接口的应用场景和实现思路
    本文介绍了FineReport平台数据分析图表显示部分系列接口的应用场景和实现思路。当图表系列较多时,用户希望可以自己设置哪些系列显示,哪些系列不显示。通过调用FR.Chart.WebUtils.getChart("chartID").getChartWithIndex(chartIndex).setSeriesVisible()接口,可以获取需要显示的系列图表对象,并在表单中显示这些系列。本文以决策报表为例,详细介绍了实现方法,并给出了示例。 ... [详细]
  • 本文介绍了简书APP的PRD文档规范写法及内容概述。PRD文档的要求因公司、团队或产品而异,本文总结了简书APP的PRD文档框架,包括版本信息、文档说明、产品简介、产品特色、用户分析和产品架构等内容。简书APP致力于提供最好的分享体验,为写作者打造最优秀的写作软件,为阅读者打造最优雅的阅读社区。主要用户为喜欢分享交流、爱生活拥有文艺气息的年轻人,喜爱文字并想在喧嚣网络中沉淀文字的读写人。产品架构包括了主要模块,并应展开至最小用户可见单元。 ... [详细]
  • 2022年的风口:你看不起的行业,真的很挣钱!
    本文介绍了2022年的风口,探讨了一份稳定的副业收入对于普通人增加收入的重要性,以及如何抓住风口来实现赚钱的目标。文章指出,拼命工作并不一定能让人有钱,而是需要顺应时代的方向。 ... [详细]
  • Python开源库和第三方包的常用框架及库
    本文介绍了Python开源库和第三方包中常用的框架和库,包括Django、CubicWeb等。同时还整理了GitHub中最受欢迎的15个Python开源框架,涵盖了事件I/O、OLAP、Web开发、高性能网络通信、测试和爬虫等领域。 ... [详细]
  • 如何使用代理服务器进行网页抓取?
    本文介绍了如何使用代理服务器进行网页抓取,并探讨了数据驱动对竞争优势的重要性。通过网页抓取,企业可以快速获取并分析大量与需求相关的数据,从而制定营销战略。同时,网页抓取还可以帮助电子商务公司在竞争对手的网站上下载数百页的有用数据,提高销售增长和毛利率。 ... [详细]
  • Excel中超好用的5招条件格式图表可视化 ... [详细]
  • 背景应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]
author-avatar
手机用户2502928867
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有