热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

如何掌握数据化运营的思维方式,看这一文章就够了

“数据驱动决策”,为了不让这句话成为空话,在本章的最后,作者将自己的经验提炼为以下15种思想武器,不求你当下就能掌握

“数据驱动决策”,为了不让这句话成为空话,在本章的最后,作者将自己的经验提炼为以下15种思想武器,不求你当下就能掌握,但希望你能不断参悟并修正。


1.信度与效度思维

在指标构建的内容中已经对指标的信度和效度做了阐述。这部分也许是最难理解的,但也最重要。没有这个思维,决策者很有可能在数据中迷失,如图4-57所示。


640?wx_fmt=png

度与效度思维


信度与效度的概念最早来源于调查分析,但现在可以引申到数据分析工作的各个方面。


所谓信度,是指一个数据或指标自身的可靠程度,包括准确性和稳定性。取数逻辑是否正确?有没有计算错误?这属于准确性;每次计算的算法是否稳定?口径是否一致?以相同的方法计算不同的对象时,准确性是否有波动?这是稳定性。做到以上两个方面,就是一个好的数据或指标了吗?其实还不够,还有一个更重要的因素,就是效度!


所谓效度,是指一个数据或指标的生成,需贴合它所要衡量的事物,即指标的变化能够代表该事物的变化。


只有在信度和效度上都达标,才是一个有价值的数据指标。举个例子:要衡量身体的肥胖情况,选择穿衣的号码作为指标,一方面,相同的衣服尺码对应的实际衣服大小是不同的,会有美版、韩版等因素,使得准确性很差;另一方面,一会儿穿这个牌子的衣服,一会儿穿那个牌子的衣服,使得该衡量方式形成的结果很不稳定。所以,衣服尺码这个指标的信度不够。尺码大小并不能准确反映肥胖情况,因此效度也不足。体脂率才是信度和效度都比较达标的肥胖衡量指标。


在我们的现实工作中,许多人会想当然地拿了指标就用,这是非常值得警惕的。你要剁骨头却拿了把手术刀,是不是很可悲?信度和效度的本质,其实属于数据质量的问题,这是一切分析的基石,再怎么重视都不过分!


2.平衡思维

说到天平读者都不陌生,平衡的思维相信也都能很快理解。简单来说,在数据分析的过程中,需要经常寻找事情间的平衡关系,且平衡关系往往是关乎企业运转的大问题,如市场的供需关系,薪资与效率关系,工作时长与错误率的关系等。


平衡思维的关键点在于寻找能展示出平衡状态的指标。也就是图4-58所示的框,要通过这个准确的量化指标观察天平的倾斜程度。怎么找这个指标呢?一般先找双向型的问题,即“高也不是低也不是”的问题,然后量化为指标,最后计算成某个比率,长期跟踪后观察它的信度和效度。


640?wx_fmt=png

平衡思维


举个电商的例子,在电商的用户行为分析中,用户每次访问的深度就是一个“高不成低不就”的问题。若用户访问深度过深,每次都要浏览很多个页面,说明他在这里没有遇到想要的产品,或者页面没有促使他快速购买,这不是一家电商公司想看到的情况;若用户每次访问都很浅,看一两个页面就走掉了,说明你的产品展示、内容引导很有问题。那么,访问深度多少是合适的呢?这就是数据分析人员需要研究的问题——在多深的访问深度时,用户形成购买的概率最大。


3.分类思维

客户分群、产品归类、市场分级、绩效评价等许多事情都需要有分类的思维。主管拍脑袋也可以分类,通过机器学习算法也可以分类,到底分类思维怎么应用呢?


关键点在于,分类后的事物需要在核心关键指标上能拉开距离!也就是说,分类后的结果必须是显著的。如图4-59所示,横轴和纵轴往往是你运营中关注的核心指标(当然不限于二维),而你能看到分类后的对象分布不是随机的,而是有显著的集群的倾向。


640?wx_fmt=png

分类思维


举个例子,假设图4-59所示反映了某个消费者分群的结果,横轴代表购买频率,纵轴代表客单价,那么图中右上角的这群人,就是明显的“金牌客户”。右下角这个象限的人群,就是“屌丝”群体,他们“频繁地买便宜货”。左上角的人群是精英阶层,他们“选购好商品”。左下角的人群可以归结为长尾客户,不需要我们花精力去维护,让他们自然生长,转变为其他三个象限的人群后,我们再施以针对性的策略。


4.矩阵思维

如图4-60所示,矩阵思维是分类思维的延伸,它不再局限于用量化指标进行分类。许多时候,我们没有数据作支持,只能通过经验做主观的推断,可以把某些重要因素组合成矩阵,大致定义出好坏的方向,然后进行分析。


640?wx_fmt=png

矩阵思维


我们在上文中提到的“重要—紧急矩阵”,就是矩阵思维的一个例子。


5.管道/漏斗思维

这种思维方式已经比较普及了,注册转化、购买流程、销售管道、浏览路径等,很多分析场景中都能找到这种思维的影子,如图4-61所示。


640?wx_fmt=png

漏斗思维


作者认为看上去越是普世、越是容易理解的模型,它的应用越得谨慎和小心。在漏斗思维中,我们尤其要注意漏斗的长度。


漏斗从哪里开始到哪里结束?以作者的经验,漏斗的环节不该超过5个,且漏斗中各环节的百分比数值、量级不要超过100倍(漏斗第一个环节从100%开始,到最后一个环节的转化率数值不要低于1%)。若超过了这两个数值标准,建议分为多个漏斗进行观察。当然,这两个是经验数值,仅为读者提供一个参考。


理由是什么呢?超过5个环节,往往会出现多个重点环节,那么在一个漏斗模型中分析多个重要问题容易产生混乱。数值量级差距过大,数值间变化的实际意义很难被察觉,容易遗漏信息。例如,漏斗的第一个环节到第二个环节的转化率从60%变到50%,让你感觉是天大的事情,而漏斗最后环节的转化率发生0.1%的变动,你却不以为然,其实往往是漏斗最后这0.1%的变动非常致命。


6.相关思维

如图4-62所示,我们观察指标,不仅要看单个指标的变化,还需要观察指标间的相互关系。有正相关关系(实线)和负相关关系(虚线)。最好能时常计算指标间的相关系数,定期观察变化。


640?wx_fmt=png

相关思维


现在很多企业管理层,面对的问题并不是没有数据,而是数据太多,有用的数据太少。相关思维的一个应用,就是帮助我们找到最重要的数据,排除过多杂乱数据的干扰。


如何执行呢?可以计算能收集到的多个指标间的相互关系,挑出与其他指标相关系数都相对较高的数据指标,分析它的产生逻辑、对应的问题,并评估信度和效度,若都满足标准,这个指标就能定位为核心指标。


建议读者养成一个习惯,经常计算指标间的相关系数,仔细思考相关系数背后的逻辑,或许能给你带来惊喜!另外,“没有相关关系”,也会成为惊喜的来源。在第5章中,我们会针对相关系数模型做详细的讨论,你会更多地体会相关思维的好处。


7.远近度思维

在与许多处在管理层的朋友交流后,发现他们往往手握众多数据和报表,注意力却非常跳跃和分散。这当然不是好现象,但如何避免呢?一是通过相关思维,找到最核心的问题和指标;二是建立远进度的思维方式,如图4-63所示。


640?wx_fmt=png

远近度思维


确定好核心问题后,分析其他业务问题与该核心问题的远近程度,由近及远,有计划地分配自己的精力。例如,近期你的核心任务是提高客服人员的服务质量,那么客服人员的话术、客户评价通道、客服系统的响应速度等就是靠得最近的子问题,需要重点关注,而客户的问询习惯、客户的购买周期等就是相对远的问题,暂时先放一放。


除了事务的远近度,还需要思考人事的远近度。与核心业务指标关系近的人,需要重点关注,多检查他们的工作方式和工作效率,多与他们沟通,保持信息的同步。


8.逻辑树思维

如图4-64所示,树状图相信大家见过许多回了。一般说明逻辑树的分叉时,都会提到“分解”和“汇总”的概念。这里把它变一变,使其更贴近数据分析,称为“下钻”和“上卷”。当然,这两个词不是作者发明的,早已有之。


640?wx_fmt=png

逻辑树思维


下钻和上卷并不是局限于一个维度的,往往是多维组合的节点进行分叉。逻辑树引申到算法领域就是决策树。有个关键点是何时做出决策(判断)。当进行分叉时,往往会选择差别最大的一个维度进行拆分,若差别不够大,则这个枝芽就不再细分。能够产生显著差别的节点会被保留,并继续细分,直到分不出差别为止。经过这个过程,我们就能找出影响指标变化的因素。


举个川术公司的例子:作为川术公司的CEO,你发现全国客户数量下降了,你从地区和客户年龄层级两个维度先进行观察,发现各个年龄段的客户都在下降,而地区间有的下降有的升高,说明按地区进行分支能够获得更多信息,我们就按地区来拆分第一个逻辑树节点。拆分到大区后,发现各省间的差别是显著的,那就继续拆分到城市,最终发现是浙江省杭州市的大量客户(涵盖各个年龄段),被竞争对手的一波推广活动转化走了。就此,通过三个层级的逻辑树找到了问题所在。


9.时间序列思维

很多问题,我们找不到横向对比的方法和对象,那么,和历史上的状况比,就将变得非常重要。其实很多时候,作者更愿意用时间维度的对比来分析问题。这种方式容易排除一些外在干扰,尤其适合创新型的分析对象(没有参照物),比如一个新行业的公司,或者一款全新的产品。


时间序列的思维有三个关键点:一是距今越近的时间点,越要重视(在图4-65中用颜色的深浅度表示,越近期发生的事,越有可能再次发生);二是要做同比(用箭头指示,指标往往存在某些周期性,需要在周期中的同一阶段进行对比才有意义);三是异常值出现时,必须重视(比如出现了历史最低值或历史最高值,建议在时间序列作图时,添加平均值线和平均值加减一倍或两倍标准差线,便于观察异常值)。


640?wx_fmt=png

时间序列思维


时间序列思维有一个子概念不得不提,就是“生命周期”的概念。用户、产品、人事等无不有生命周期存在。衡量清楚生命周期,就能方便地确定一些“阈值”问题,使产品和运营的节奏更明确。


10.队列分析思维

随着数据运算能力的提高,队列分析(Cohort Analysis)的方式逐渐崭露头脚,如图4-66所示。作者的理解是按一定的规则,在某些维度上将观察对象切片,组成一个观察样本,然后观察这个样本的某些指标随着时间的演进而产生的变化。目前使用得最多的场景就是留存分析。


640?wx_fmt=png

 队列分析思维

举个川术公司的例子:该公司在5月17日举办了一次促销活动,将这一天来的新用户作为一个观察样本,观察他们之后每天的活跃情况。可以想象,若在5月17日、6月17日、7月17日都举办了活动,那么这三天来的新用户,在注册后一段时间的使用情况就像3条队伍一样向后延伸。


11.循环/闭环思维

如图4-67所示,循环/闭环的概念可以引申到很多场景中,例如业务流程的闭环、用户生命周期闭环、产品功能使用闭环、市场推广策略闭环等。许多时候你会觉得这是一个不落地的概念,因为提的人很多,干出事情的很少。


640?wx_fmt=png

闭环思维


业务流程的闭环是管理者比较容易定义出来的,列出公司所有业务环节,梳理出业务流程,然后定义各个环节之间相互影响的指标,跟踪这些指标的变化,能从全局上把握公司的运行状况。


例如,川术软件公司的典型业务流:推广行为(市场部)→流量进入主站(市场+产研)→注册流程(产研)→试用体验(产研+销售)→进入采购流程(销售部)→交易并部署(售后+产研)→使用、续约、推荐(售后+市场)→推广行为,一个闭环下来,各个衔接环节的指标,就值得关注了:广告点击率→注册流程进入率→注册转化率→试用率→销售管道各环节转化率→付款率→推荐率/续约率……这里会涉及漏斗思维,但千万不要用一个漏斗来衡量一个循环。


不知你有没有发现,闭环思维,实际上提供了一种设计指标体系的方式。有了循环思维,你能比较快地建立有逻辑关系的指标体系。


12.测试/对比思维

如图4-68所示,A/B测试大家肯定不陌生。一是在条件允许的情况下,决策前尽量做对比测试;二是测试时,一定要注意参照组的选择,建议任何实验中都留有不进行任何变化的一组样本,作为最基本的参照。


640?wx_fmt=png

测试思维


现在很多公司都能支持灰度发布,数据获取也越来越方便。因此,在保证数据质量的前提下,希望大家多做实验,多去发现规律。在使用A/B测试方法时,在进行数据分析时千万不要忘记上文中所介绍的DID方法。


13.指数化思维

如图4-69所示,指数化思维是指将衡量一个问题的多个因素分别量化后,组合成一个综合指数(降维)来持续追踪。前文已经说过,许多管理者面临的问题是“数据太多,可用的太少”,这就需要“降维”,即把多个指标压缩为单个指标。


640?wx_fmt=png

指数化思维


指数化的好处非常明显,一是减少了指标,使得管理者精力更集中;二是指数化的指标往往提高了数据的信度和效度;三是指数能长期使用且便于理解。

指数的设计是门大学问,这里简单提三个关键点:一是要遵循独立和穷尽(MECE)的原则;二是要注意各指标的单位,尽量做标准化来消除单位的影响;三是权重和要等于1。


举个例子:在设计川术公司销售部门的指标体系时,目的是衡量销售部的绩效,确定了核心指标是销售额后,你将绩效拆分为订单数、客单价、线索转化率、成单周期、续约率5个相互独立的指标,且这5个指标涵盖了销售绩效的各个方面(穷尽)。你设计的销售绩效综合指数=0.4×订单数+0.2×客单价+0.2×线索转化率+0.1×成单周期+0.1×续约率,各指标都采用max-min的方法进行标准化。这样,作为销售总监,在时间仓促时,只需要盯住销售绩效综合指数这一个数字,就能知道各个销售团队或者销售员的表现,而不需要从多维度进行对比。


14.极端化思维

许多时候,我们总觉得想解答的问题受到各种因素的干扰,有正向的也有反向的,如图4-70所示。这时,建议大家启用极端化思维。一是把众多因素极端地缩减到1个或者2个;二是把这一两个因素的影响放到最大。例如,在思考竞争格局时,不妨将思考因素锁定为一个,并将它的影响设定为最大(如潜在进入者只有一家,它是全球最有钱的公司),然后想想我们自身的机会在哪里,该怎么做。


640?wx_fmt=png

极端化思维


在数据分析中,多因素影响的窘境是经常遇到的。往往一个指标的变动受到太多因素的影响,根本分解不出来。这时,就会假设指标只受到与它相关性最高的那一个因素的影响,同时维度上也只挑选一个维度,然后去探查原因。


15.反向思维

反向思维一般应用在历史数据回顾这样的场景中。在回顾历史数据的需求产生时,往往会先列出一堆当前看来非常正常的事情,然后一项项地将当前正常的事情所对应的反常情况罗列出来,最后到历史数据中寻找反常事件出现的时间或者维度,如图4-71所示。


640?wx_fmt=png

反向思维


在运营中,我们可以采用这种思维方式观察数据,或者不自觉地采用这种思维方式观察数据。我们将自己认知的正常的数据表现(大部分情况下出现的)进行详细的罗列,然后列出它们所对应的反常情况。在追踪数据时,我们的注意力就着重放在这些反常情况上。反常情况一旦出现,我们就需要定位问题。


作者:胡晨川; 本文接自《数据化运营速成手册》4.6章节,获作者与出版社授权转载。

原创系列文章:

1:从0开始搭建自己的数据运营指标体系(概括篇)

2 :从0开始搭建自己的数据运营指标体系(定位篇)

3 :从0开始搭建自己的数据运营体系(业务理解篇)

4 :数据指标的构建流程与逻辑

5 :系列 :从数据指标到数据运营指标体系

6:   实战 :为自己的公号搭建一个数据运营指标体系

数据运营 关联文章阅读:  

运营入门,从0到1搭建数据分析知识体系    

推荐 :数据分析师与运营协作的9个好习惯

干货 :手把手教你搭建数据化用户运营体系

推荐 :最用心的运营数据指标解读

干货 : 如何构建数据运营指标体系

从零开始,构建数据化运营体系

干货 :解读产品、运营和数据三个基友关系

干货 :从0到1搭建数据运营体系

数据分析、数据产品 关联文章阅读:

干货 :数据分析团队的搭建和思考

关于用户画像那些事,看这一文章就够了

数据分析师必需具备的10种分析思维。

如何构建大数据层级体系,看这一文章就够了

干货 : 聚焦于用户行为分析的数据产品

如何构建大数据层级体系,看这一文章就够了

80%的运营注定了打杂?因为你没有搭建出一套有效的用户运营体系

从底层到应用,那些数据人的必备技能

读懂用户运营体系:用户分层和分群

做运营必须掌握的数据分析思维,你还敢说不会做数据分析

商务合作|约稿 请加qq:365242293  


更多相关知识请回复:“ 月光宝盒 ”;

数据分析(ID : ecshujufenxi )互联网科技与数据圈自己的微信,也是WeMedia自媒体联盟成员之一,WeMedia联盟覆盖5000万人群。

640?wx_fmt=png


推荐阅读
  • 浏览器中的异常检测算法及其在深度学习中的应用
    本文介绍了在浏览器中进行异常检测的算法,包括统计学方法和机器学习方法,并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测,可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率,而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 云原生边缘计算之KubeEdge简介及功能特点
    本文介绍了云原生边缘计算中的KubeEdge系统,该系统是一个开源系统,用于将容器化应用程序编排功能扩展到Edge的主机。它基于Kubernetes构建,并为网络应用程序提供基础架构支持。同时,KubeEdge具有离线模式、基于Kubernetes的节点、群集、应用程序和设备管理、资源优化等特点。此外,KubeEdge还支持跨平台工作,在私有、公共和混合云中都可以运行。同时,KubeEdge还提供数据管理和数据分析管道引擎的支持。最后,本文还介绍了KubeEdge系统生成证书的方法。 ... [详细]
  • 近年来,大数据成为互联网世界的新宠儿,被列入阿里巴巴、谷歌等公司的战略规划中,也在政府报告中频繁提及。据《大数据人才报告》显示,目前全国大数据人才仅46万,未来3-5年将出现高达150万的人才缺口。根据领英报告,数据剖析人才供应指数最低,且跳槽速度最快。中国商业结合会数据剖析专业委员会统计显示,未来中国基础性数据剖析人才缺口将高达1400万。目前BAT企业中,60%以上的招聘职位都是针对大数据人才的。 ... [详细]
  • Android中高级面试必知必会,积累总结
    本文介绍了Android中高级面试的必知必会内容,并总结了相关经验。文章指出,如今的Android市场对开发人员的要求更高,需要更专业的人才。同时,文章还给出了针对Android岗位的职责和要求,并提供了简历突出的建议。 ... [详细]
  • [译]技术公司十年经验的职场生涯回顾
    本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同,令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望,认为人类有能力不断改善自己。 ... [详细]
  • Go语言实现堆排序的详细教程
    本文主要介绍了Go语言实现堆排序的详细教程,包括大根堆的定义和完全二叉树的概念。通过图解和算法描述,详细介绍了堆排序的实现过程。堆排序是一种效率很高的排序算法,时间复杂度为O(nlgn)。阅读本文大约需要15分钟。 ... [详细]
  • 词袋模型的通俗介绍
    词,袋, ... [详细]
  • 图解redis的持久化存储机制RDB和AOF的原理和优缺点
    本文通过图解的方式介绍了redis的持久化存储机制RDB和AOF的原理和优缺点。RDB是将redis内存中的数据保存为快照文件,恢复速度较快但不支持拉链式快照。AOF是将操作日志保存到磁盘,实时存储数据但恢复速度较慢。文章详细分析了两种机制的优缺点,帮助读者更好地理解redis的持久化存储策略。 ... [详细]
  • 计算成像的原理与应用研究
    本文探讨了计算成像的原理与应用研究。首先介绍了小孔成像实验和软件方面的相关内容。随后从傅里叶光学的角度简单谈了成像的过程。成像是观测样品分布的一种方法,通过成像系统接收光的强度来呈现图像。视网膜作为接收端接收到的图像实际上是由像元组成的矩阵,每个元素代表相应位置像元接收光的强度。大脑通过对图像的分析,得出一系列信息,如识别物体、判断距离等。计算成像是一种采集记录系统,通过处理数据得到样品分布与像的对应关系,用于后续问题的分析。 ... [详细]
  • 第四章高阶函数(参数传递、高阶函数、lambda表达式)(python进阶)的讲解和应用
    本文主要讲解了第四章高阶函数(参数传递、高阶函数、lambda表达式)的相关知识,包括函数参数传递机制和赋值机制、引用传递的概念和应用、默认参数的定义和使用等内容。同时介绍了高阶函数和lambda表达式的概念,并给出了一些实例代码进行演示。对于想要进一步提升python编程能力的读者来说,本文将是一个不错的学习资料。 ... [详细]
  • 一句话解决高并发的核心原则
    本文介绍了解决高并发的核心原则,即将用户访问请求尽量往前推,避免访问CDN、静态服务器、动态服务器、数据库和存储,从而实现高性能、高并发、高可扩展的网站架构。同时提到了Google的成功案例,以及适用于千万级别PV站和亿级PV网站的架构层次。 ... [详细]
  • 本文介绍了使用哈夫曼树实现文件压缩和解压的方法。首先对数据结构课程设计中的代码进行了分析,包括使用时间调用、常量定义和统计文件中各个字符时相关的结构体。然后讨论了哈夫曼树的实现原理和算法。最后介绍了文件压缩和解压的具体步骤,包括字符统计、构建哈夫曼树、生成编码表、编码和解码过程。通过实例演示了文件压缩和解压的效果。本文的内容对于理解哈夫曼树的实现原理和应用具有一定的参考价值。 ... [详细]
  • 从高级程序员到CTO的4次能力跃迁!如何选择适合的技术负责人?
    本文讲解了从高级程序员到CTO的4次能力跃迁,以及如何选择适合的技术负责人。在初创期、发展期、成熟期的每个阶段,创业公司需要不同级别的技术负责人来实现复杂功能、解决技术难题、提高交付效率和质量。高级程序员的职责是实现复杂功能、编写核心代码、处理线上bug、解决技术难题。而技术经理则需要提高交付效率和质量。 ... [详细]
  • Learning to Paint with Model-based Deep Reinforcement Learning
    本文介绍了一种基于模型的深度强化学习方法,通过结合神经渲染器,教机器像人类画家一样进行绘画。该方法能够生成笔画的坐标点、半径、透明度、颜色值等,以生成类似于给定目标图像的绘画。文章还讨论了该方法面临的挑战,包括绘制纹理丰富的图像等。通过对比实验的结果,作者证明了基于模型的深度强化学习方法相对于基于模型的DDPG和模型无关的DDPG方法的优势。该研究对于深度强化学习在绘画领域的应用具有重要意义。 ... [详细]
author-avatar
小宇宇宙2502862273
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有