来源|小飞象&;木木自由
数据分析比作一场战役,数据分析思路就像战役的总指挥影响着整个战役的胜败一样,有着关键性的作用。一个体系化的分析思路可以将复杂的数据分析工作进行拆解,让数据分析的过程更加严谨,使结论落地执行,提高工作效率。
1数据分析思路在实际工作场景中,一般情况下,数据分析人员大部分时间做数据处理等相关工作,在形成体系化分析思路就会被忽视。当面对具体业务问题时,突然间头脑中的思绪仍是一团乱麻,看着数据却不知道怎么用数据来论证业务问题。杂乱无章的分析只能帮助我们找到一些片面原因,甚至会把我们带离正确的方向。
因此,懂得如何形成一个体系化的数据分析思路是每个数据分析人员必须具备的能力。“分析思路”本质上就是站在一定高度去的多维度分析或者拆解业务逻辑等相关问题。
具体思路,如下:
❶ 定义问题(重要步骤之一):
1)首先,要搞清楚问题的实质,准确、完整、真实地表达问题。
2)其次,弄清楚为什么要解决这个问题?
3)最后,解决这个问题的意义何在?是必须解决还是无关紧要,或是需要马上解决这个问题还是不太着急。
❷ 结合具体业务场景,收集整理信息,了解整体数据情况:
搜集、整理关于要解决问题的历史资料、类似情况和现状。例如,从现有的报表数据中就能看到当前问题点的数据情况或者一段时间的趋势。
❸ 根据需求问题和目标,明确分析的数据指标以及选取分析方法:
1)分析涉及到的主要维度,为后面提取数据需求做准备;
2)选取的分析软件以及分析方法(统计学相关方法)。
❹ 数据提取整理,确保数据的准确性(重要步骤之二):
1)根据分析内容以及分析方法,提出分析所需的数据需求;
2)对于反馈回来的数据,需要进行部分加工,以便更能反映所要分析的问题。
❺ 了解核心指标,观察数据规律变化,分析结果及结论:
1)通过数据监控,发现异常情况,与同期对比,按时序看走势,必要时拆解结构,找出异常,进而下钻分析原因,从而锁定问题点,进行深入分析。
2)根据分析的结果,得出一些当前问题产生的一些结论。这里注意分析的方法以及维度,结果的展示方式等。
3)结论需要足够的数据作支撑。
❻ 挖掘异常变化的原因,有逻辑的进行论证及建议措施:
1)针对数据分析结论,给出当前问题的解决建议措施;
2)一般常用的数据分析模型为结构分析法+指标拆解法。对问题进行拆解,找到问题发生点;
3)一方面从业务层面进行建议措施。另一方面,可以就问题点进行更深层次分析,给出数据挖掘层面的解决措施。
❼ 进行问题点测试,验证分析结果及报告整理:
1)根据措施实施效果进行评估,将完成的分析过程、结果以及评估整理报告,为以后出现问题提供经验教训;
2)找问题点后,进行多轮测试验证,确保分析结果准确性可靠性,还能知道哪种方法好用,发现内在逻辑,积累分析实战经验。
(问题展现方式)2实践案例我们以一个实际的工作场景为例:互联网产品公司,产品运营同事找到数据分析师说:“DAU下降了,帮忙分析一下原因”
首先,定义问题,才能知道,在数据分析中什么问题是一定要解决的,结果才能真正的落地。一个完整的业务数据分析问题主要是业务遇到的问题和分析的方向,我们梳理问题逻辑时必须掌握定义问题的一些思路和知识。了解问题的结构,我们就可以将错综复杂的问题,用逻辑清晰的方式提炼出问题本质,为理解业务、分析结果落地、指导后续分析方向都有着非常重要的意义。
5W2H法:Where——哪里存在问题?What——存在的问题是什么?Why——原因在哪里?When——什么时候开始出现这样的问题?Who——与什么对象有关?How many——发生的次数和数量?How much——损失有多大?
与业务沟通后,进一步明确了问题:2023年4月DAU环比/同步下降30%,而正常波动范围是±10%,因此认为有显著下降。此次分析的目标在于找出下降的主要原因,并在下个月(5月)解决。
其次,梳理分析思路如下:
第一、确认数据真实性,了解整体数据情况
数据质量是数据分析的生命线,在开始着手分析前,一定要确认数据的真实性:DAU环比/同步下降30%的准确性。我们经常会遇到数据服务、数据上报、数据统计上的BUG,在数据报表上就会出现异常值。所以,先去找数据流相关的产品和研发确认下数据的真实性。
了解整体数据情况,如,pv、日均访问量、用户总数、订单数、会员数、总销售额、用户来源分布及占比、有购买行为的用户数量、用户的客单价、复购率分别是多少?等等整体用户概况数据。了解到活跃用户的规律。市场政策的变化,节假日、电商节等节日,常见的运营策略调整都能引发活跃数据变化。找到一些明显的规律后,根据未来要发生的时间,预计指标波动情况,及时调整运营策略。
如下图,可看出活跃用户数在周末以及十一节假日呈阶梯式下降,有对应事件发生以及对应波动形态,可见具有周期性规律,在周末时可调整营销活动等运营策略,使增长趋势平稳,但要综合考虑产品属性和用户属性。
注:为某考勤类APP十月份活跃数据趋势图,已做数据脱敏处理。第二、确定结合具体业务场景,拆解日活(DUA)指标
常见的初步拆分维度,通过初步拆分,定位原因大致范围。如下图:
第三、通过对比分析方法,DUA同比/环比/占比观察,区分活跃数据的异常变化情况
通过DUA同比/环比/占比观察,出现阶梯式、持续性、非规律性等活跃波动为异常。但不是所有的异常波动都值得排查,但是要记录发生时间,观察走势,当问题出现恶化时容易溯源。这就是为什么要建立数据监控体系。
如下图,可看出活跃用户数在10月22日到10月24日红框区域出现活跃异常波动,首先要了解日活究竟跌了多少,其次通过通过DUA同比/环比/占比观察,跌幅是否在合理的范围,最后确定为非规律性异常。
注:为某考勤类APP十月份活跃数据趋势图,已做数据脱敏处理。第四、异常范围定位后,挖掘异常变化的原因,进一步做假设
针对初步定位的影响范围,进行进一步的排查。分三个维度来做假设,建议针对数据异常问题专门建一个群,拉上相应的产品、技术、运营人员一起,了解数据异常时间点附近做了什么产品、运营、技术侧调整。
综合考虑以往数据异常原因、产品运营技术侧调整、初步定位影响范围可能由什么原因造成,再结合自身业务经验确定几个最可能的原因假设,给这些假设排数据验证的优先级,逐一排查。
第五、细分假设,确立原因
除了上述,可以细分分析的维度实在太多了,逻辑上说核心点在于一个假设得到验证后,在这个假设为真的基础上,进行更细维度的数据拆分。
我们需要记住这种分析方式,当猜测是某种原因造成数据异常时,只要找到该原因所代表的细分对立面做对比,就可以证明或证伪我们的猜测,直到最后找到真正原因。
第六,进行问题点测试,验证分析结果
拆分新老用户活跃量(因为如果不是产品异常,最有可能的是新用户影响的)通过分析,如果确定是新用户问题,我们再把新用户日活按渠道进行拆分:新用户=渠道1+渠道2+渠道3+其他渠道
通过渠道拆分,我们会发现是具体哪个渠道效果发生的问题,验证分析结果。然后去联系此渠道的负责人一起定位具体原因,是渠道转化率降低?还是渠道平台的问题?等等找出原因后,再针对原因解决问题,制定渠道优化策略。
小结数据分析思路其实是在做数据分析的从头到尾的流程,是对业务分析目标的细化以及拆解。但要解决实际业务场景中遇到的问题,要先明确具体需要解决的问题,才能针对性的思考相关解决思路。分析的问题如果都不清晰,就会造成分析思路的偏离。
“分析思路”直接奠定了数据分析结论准确、是否实用、是否落地。我们还要学会运用系统的分析方法来辅助“分析思路”,可以高效迅速地达成目标。