发表于: 2019-09-11 21:02:03
1 346
一、今天完成的任务
1、画原型图
二、明天的计划
1、画原型图
三、遇到的问题及思考
业务中数据分析的一般方法
前面简单说了数据分析的方法工具误区和数据分析核心是要去寻找两组变量之间的关系。
那在业务中,如何进行有效的数据分析。我将数据分析归纳为以下五个步骤:
- 第一步,感知问题
- 第二步,提出假说
- 第三步,选择表征
- 第四步,收集数据
- 第五步,分析验证
第一步,感知问题
如果没有问题,是不需要数据分析的。
但是,那是不可能的。KPI总是差点才达到,即使达到了,领导还会问你,就不能做到更好吗?
在业务中的问题有这样两种,一种是直接找最终结果的问题,比如收入比不上竞品,DAU下降了10%等;一种是环节上的问题,拆解漏斗和业务环节,比如通过分析app数据漏斗,发现每日使用一次人数相对于每日打开人数相对于流失了30%等。
记住这样一句话,但凡有差异,必有问题,但凡有问题,必要寻找原因。
这一步困难的不是有没有问题,差距、不足总是在那里。困难的是,能不能找到最重要,也就是最和业务结果相关的问题,优先级排序是关键。
而排序的关键就是,基于最重要的结果或KPI的标准进行排序。不断思考一件事,解决了这个问题能够对结果有多大的改善?
第二步,提出假说
找到问题,下一步就是找方法解决。
在管理咨询界有个说法,叫作不要煮沸海洋。说的是,把所有的,可能导致问题的因素全部找出来分析一遍,那是低效也是不可能的。
所以,这里就需要使用到「假说」的方法。
哪些因素可能影响到收入?哪些因素会导致打开app的人不使用任何功能直接离开?
找到以上问题可能的答案的过程,就是提出假说的过程。
这里有两个路径用来提出假说,一个是归纳的方式,一个是演绎的方式:
什么是归纳式的,就是根据个案进行总结。比如在收入可能的影响因素的时候,我会找所有相关工作人员进行头脑风暴,提出可能的因素;也会对分层的用户进行抽样深读访谈,了解他们购买或不购买的原因及其他看法。
什么是演绎式的,就是根据模型进行推演。比如在app打开不使用直接离开,我们可以根据对用户行为模型的理解进行拆解,而拆解的有效与否,其实就是关于你模型多少、深度。
结合归纳式和演绎式的方法,我们会得到非常多的可能与结果相关因素。进行整理,并进行重要性排序。
到这里,我们就找出很多可能、未经确定、未经量化的y=f(x),也就是一对对可能有关系的变量。
第三步,选择表征
不可被数据量化,就不能被改变。如前文所说,数据分析,需要将现象量化,得到可以分析的数据。
所以,需要将提出的假说中所选择的变量,用数据来进行表征。
在入群时间点对用户活跃度影响的例子中,我们将入群时间点(x)定义为:入群时间与开群时间差;将活跃度(y)定义为用户从进入起一周的活跃率,即一月内活跃天数的占比。
在选择数据表征元素的时候,需要把握的原则就是:
- 选择的数据能够充分代表假说中变量的内涵;
- 选择的数据尽量是用户客观行为数据而非主观态度数据;
- 选择的数据是有被记录或容易获取。
第四步,收集数据
互联网的很大优势就是数据驱动的,数据往往是被有效收集的。
但是,也存在数据没有被记录情况。支持产品功能的数据,会被记录,但是很多行为数据只能通过调取接口数据或埋点的方式进行记录。这就需要业务人能够提前规划所需数据,让工程师将数据记录在库。
在收集数据的过程中,需要注意到就是有效数据量不能太小。
第五步,分析验证
反倒是,分析验证这个步骤变得不是那么核心的步骤。
确定好了x与y的含义和数据,剩下的分析就很简单了。通过数据可视化的方式,表现出x与y的关系,就能发现其中是否存在有价值的规律。
发现x与y存在某种关系的时候,最好通过数据进行再次验证。选择另外一组数据,再次进行分析,看确定的关系是否再次被复现。
当然,最重要的验证是在业务实现中体现。
数据分析,一种必备能力
数据分析,是认识事物的重要方式之一,它的特点是定量的非定性的、过去的非未来的、相关的非因果的,有其适用范围,但一定是所有业务人必须掌握的能力。
对于业务人,不用太崇拜于方法和工具,首先需要锤炼分析思维,寻找两个变量的关系,真正指导业务才是关键。
而在分析的过程中,「提出假说」和「选择表征」是关键所在,也是很多业务人没有能够作出有效分析的关键所在。
四、收获
1、数据分析的部分认识
评论