1、整体带来的错觉
当我们观察宏观的数据时,常常会发现有些东西 无法理解
。例如为什么人人都说楼价在跌,但公布的楼价数据却在涨?例如为什么经济感受那么差,宏观数据却还是在涨?
如果我们只在于 某个粒度
的数据,而不去考虑产生数据的 底层逻辑
,很容易会被看到的数据所 误导 。
所以,我们要学习的,不是如何去 误导别人
,而是如何去 不被别人误导
。
2、一个例子
某知名连锁咖啡店在研究是否缩减店铺面积时,需要研究 店铺面积
与 销售
的关系。
抽取所有有开店的城市,看出一个趋势就是,当店铺面积越大的城市,店均销售是越差的
好,有这个数据支持,我们全部店铺可以通过缩减面积 ( 降低租金 ) ,还可以顺带提升销售,多好
但…不对啊,与直观逻辑对不上啊,我店铺面积大一点,不就能多点桌子,就能做多点生意了么?
不对劲
3、继续细拆
当我抽取几个城市的店铺来看一下先
哎哟,还是很乱…
只好逐个城市来看了
诶?这两个城市都是销售随着面积越大而提升的哦,我抽多两个城市来看看
诶,逐个城市来看,店铺面积与销售都是呈正相关的。
就是在同一个城市内,店铺的面积越大,销售会越高
但如果把他们的平均值放到一起,就会看到
北京、广州的店铺,销售
明显高于北海、大理。但 面积
远小于 北海、大理。
4、背后的逻辑
经过对大多数城市的继续细拆,可以得知:
- 在大城市中,店铺面积会较小城市小
- 在大城市中,平均销售较小城市的高
- 在同样的店铺面积中,大城市的销售会比小城市的高
- 在同一个城市中,店铺面积越大,销售越高
5、如果不认真思考数据背后的逻辑
如果在刚开始,我们通过城市粒度去看这件事情,我们很容易会得出 面积越小,销售也会越高
的结论,从而对我们的目的 “是否需要缩减店铺面积” 而给出一个简单的 肯定答案 。
但如果细拆到城市内店铺间的粒度,我们会发现其实结论是相反的。
同样,如果我们在做任何决策时,就依据很浅显的数据去做决定,那么我们很有可能得到一个错误的答案。
6、是否需要不断放大?
其实也不需要,我们首先需要明确我们的 目的
,就是 “是否需要缩减店铺面积” 。
基于这个目的我们去研究数据时,始终需要围绕着 缩减面积带来的后果 。销售是最基础的,但如 租金、店铺位置、人工成本、管理成本、机会点等 都是必须考量的。
过度的数据分析会带来 目标的失焦
,我们仅需要服务于我们的 目的
,而不是单纯的服务于 数据
。
7、如何防止过度分析?
基于我们能 操作、可控
的手段,去回应 目的
,才是数据分析的根本。
好了,到时间了,该回家了。