为了解决问题而进行数字(数据)分析非常重要,但如果不注意,就会不知不觉地让数字成了“绝对”的一方,可能会被数字耍得团团转。为了恰当地解决问题,有些事情需要在看到数字前进行思考,接下来为大家进行说明。
你准备开始负责新的区域,现在打算调查一下各家店铺的职员人数和销售额的情况。请思考职员的人数与店铺的销售额可能会存在以下哪种状态。
A的状态是,只要职员人数增加,销售额就会增加。这有可能是人员分工合理、能够高效接待顾客的状态,或者是店铺面积很大,需要较多的职员。
B的状态是,职员人数增加后,销售额反而会降低。如果店铺空间狭窄,人员增加后反而使工作效率变低,可能会导致这种趋势。不过这种情况发生的可能性应该不高。
C的状态是,基本看不出职员人数与销售额之间的关联性。销售额的影响因素不一定只有职员人数,因此C的情况也有可能发生。
如上所述,在尝试进行实际的数字分析之前,要思考一下数据有可能变成怎样的状态。
理由有两个。一是可以自由地发挥想象。一旦直接进行数据统计并转化为图表,思考的起点就会变成为统计结果或图表的状态寻找意义。大家要在头脑被统计结果或图表支配前抓住能够自由想象的时机,思考有怎样的可能性。
二是这有助于以更高的敏感度对分析后呈现的信息进行解释。如果在事前进行了思考,就会自然想知道结果如何。如果得出的结果与预想一致,就会留下“与预想一致”的印象;如果与预想的不同,就能得到一个契机去深入思考为什么会出现差异。建议大家要避免不作思考就直接进行数据分析,在事前要进行哪怕是一点点的思考。因为不管跟预想一致还是有差异,都会得到一些启发。
关键点1. 是否朝右方上扬
关键点2. 是否朝右方下降
关键点3. 是否无关联
思考的重点是,确认准备分析的数字的关联性是否存在以上这三种可能。
关于上述的三种可能,首先要判断的是有关联还是无关联。其次,如果是有关联的话,就要把握大致趋势,看看是随着一方增加另一方也会增加(朝右方上扬),还是一方增加后另一方会减少(朝右方下降)。我们以刚才的例子来分析。
1. 是否朝右方上扬
朝右方上扬的趋势意味着随着职员人数增加,销售额也会增加。职员人数增加以后,接待顾客的人手增加了,有可能促进销售额增长。
2. 是否朝右方下降
朝右方下降的趋势意味着职员人数增加后,销售额反而减少了。虽然也会存在店铺狭窄、工作效率低等可能性,但这种情况很少发生。
3. 是否无关联
除了人数以外,还可能存在对销售额会造成影响的其他要素,所以数据零散分布的状态也有可能出现。
因此,在看见数据以前,就可以预想可能存在第1或第3种状态,第2种状态的可能性较低。
严格来说,有时候形成不了朝右方上扬、朝右方下降这样直线型的关系。而且,即使是朝右方上扬,上扬的形式也是多种多样的。
在看数据前进行预想,只要大致预想属于上述三种情况中的一种就可以了。如果还能预想其他的情况,也没有问题。请大家记住,要先有预想,再进行数据分析。
练习题
请思考一下店长的经验年资与销售额之间可能存在怎样的关联性?
解答
A的状态是,店长的经验越多销售额越高。这里的前提是,在该行业里,店长的能力能左右销售额,经验越多越能积累知识技巧。这种情况是有可能存在的。
B的状态是,店长的经验越多销售额反而越低。如果店长的工作方式不妥,或许会存在这种情况。
C的状态是,基本看不出店长的经验与销售额之间的关联性。比起店长的经验年资,如果其他因素更有可能对销售额产生影响,如店铺的位置、商品本身等,也许会呈现C的状态。
现在,我们再想想其他的可能性。刚才A的前提是店长所在的行业是经验技巧能起到很大作用的行业,如果我们把前提设定为工作中能够积累的经验技巧有限,情况会变成怎样呢?
我们假设有一份工作,在第1年至第2年会积累一定的经验技巧,但工作3年以后,工作内容与前几年大致相同,这份工作即使做到第4年、第5年,也不会再积累更多的经验技巧了。这样的话,有可能变成以下的状态。
STEP UP!
接下来,我们再试想另一种情况。请思考一下店铺与车站的距离跟销售额之间的关联性。
A的状态是,距离车站越远销售额越高。一般来说,远离车站则便利性下降,顾客人数可能会减少,所以这种情况几乎不会发生。
B的状态是,距离车站越远销售额越低。与A的状态相反,便利性降低的话,这种状态是有可能出现的。
C的状态是,基本看不出店铺与车站的距离跟销售额之间的关联性。如果店铺的专业性很高,或者商品、服务等能迎合人们特别的喜好,那么不管与车站距离多远,都会有顾客来购买商品或享用服务,因此店铺与车站的距离可能跟销售额关系不大。
如果数据分析的结果如下图,那么可以如何解释呢?
总体来说,也可以说是分布零散,所以可以解释为出现了上述C的情况。
另一方面,如果稍微细心地进行分组,也可以像下图这样进行解释。
也就是说,是A和B组合起来的情况,可以解释为,距离车站越远销售额越低的情况,以及距离车站越远销售额越高的情况,这两者混合起来了。前者是类似车站前的店铺,是吸引顾客在上下班、上下学的路上顺便到店的店铺;后者是路面的店铺,吸引的不是上下班、上下学的顾客,而是驾车到店的顾客。
如上述情况,原本的数据不一定会呈现完全相同的趋势,有可能包含了多家不同类型的店铺。大家要记住,除了基本状态的1、2、3以外,还要考虑其他的可能性,而且数据的种类不一定只有一种。
最后,我们总结一下数据的处理方法。很多时候我们会像下面的左图那样,要思考数据可以说明什么。这也是非常重要的做法,但如果不注意的话,可能会把解释数据变成了目的。
此外,如果数据较多,也会存在弊端,可能会被数据牵着鼻子走。有大量数据的时候,就没办法把所有事情都统筹考虑。大家要根据自身的目的决定选用对象,例如只看某些数据,不看其他数据。
正如右图所示,要有目的性地去考虑看哪个数据、要从那个数据中读取什么信息。在这个过程中,先预想数字的关联性有哪些可能,再去看数字,就能够注意到数字实际呈现出来的事实。处理数据时,要同时意识到“数据可以说明什么”以及“从数据中可以拾取什么”这两个角度。
小结
√ 在看数据之前,首先思考可能会是怎样的情况
√ 在能够自由想象的时候,自由地思考,这很重要
√ 猜中并不是目的,通过提前预想,从与现实的差距那里也可以得到启发
√ 坦诚地接受呈现出来的结果也很重要
√ 根据数据来联想以及带着想法去看数据,这两种相辅相成的方法很重要