我在京东做数据分析,二八法则在商业数据分析中的应用
二八法则也叫帕累托法则,源于经典的二八法则,该法则表示,20的变量将直接产生80的效果,数据分析更应该围绕这20作文章,持续关注TopN的数据,是一个非常好的习惯,尤其在部分行业,虽然指标很多,但往往某些指标更有价值,二八法则不仅能分析数据,还能管理数据。
应用二八法则举例来说,比如在个人财富上可以说世界上20的人掌握着80的财富,比如马云等等这类人物。而在数据分析中,则可以理解为20的数据产生了80的效果,需要围绕这20的数据进行挖掘。二八法适用于任何行业,突出重点指标,发现其特征,然后可以思考如何让其余的80向这20转化,提高效果,本文使用PowerBI软件,应用二八法则做案例分析。
导入数据
打开PowerBI软件,在获取数据中,导入本文的商品销量数据,这里直接点击加载,若是对于数据做一些数据预处理工作,可以在转换数据中对其进行数据清洗。
数据建模
本文使用到了大量的数据建模内容,对于PowerBl的学习,重点不是可视化也不是炫酷的外表,而是数据建模、DAX语言,图表制作只需要把写好的公式拖进去就行了。
而学习数据清洗、数据建模、可视化三方面内容,精力分配建议2:7:1,不要把时间浪费在可视化上面,这里选择新建度量值。
计算销售金额。销售金额SUM(商品销量〔销售额〕)
使用CALCULATE,FILTER函数计算累计销售额,一般对于累计的销售额我们也可以按照时间维度进行累计,可以使用到时间智能函数,比如TOTALYTD函数。累计销售额CALCULATE(〔销售金额〕,FILTER(ALLSELECTED(商品销量),SUM(商品销量〔销售额〕)〔销售金额〕))
计算总销售额,CALCULATE函数在已修改的筛选器上下文中计算表达式,ALLSELECTED函数获取表示查询中所有行和列的上下文,同时保留除行和列筛选器以外的显式筛选器和上下文。总销售额CALCULATE(〔销售金额〕,ALLSELECTED(商品销量))
累计占比使用DIVIDE函数作商。累计占比DIVIDE(〔累计销售额〕,〔总销售额〕)
计算好度量值后,可以在可视化中选择建立一个表,拖入相关的度量值,具体的计算明细如下图所示。
数据可视化
设置一个80分界线,使用度量值80分界线0。8,可以用于分界。
在可视化中选择组合图,将货号拖入到共享轴,销售金额拖入到列值,累计占比和80分界线拖入到行值,作为一个次坐标轴。
如果要查看前20的商品销量情况,需要新建度量值,计算出每一个货号的销量情况。款式数量CALCULATE(DISTINCTCOUNT(商品销量〔货号〕),商品销量〔销售额〕0)
20款式数量ROUND(〔款式数量〕0。2,0)
计算前20销售额,按销售金额降序排列,然后筛选前20的款式数量,进行求和。前20销售额SUMX(TOPN(〔20款式数量〕,ALL(商品销量〔货号〕),〔销售金额〕,DESC),〔销售金额〕)
前20销售占比DIVIDE(〔前20销售额〕,〔销售金额〕)
要查看不同类别的销售额,销售量情况,可以制作一个矩阵表,拖入行的值用于分类,拖入值显示数值大小。
除了必要的图表展示,还要加一些筛选器,用于动态筛选,这里使用切片器,在可视化中点击筛选器,拖入季节字段,发现其显示春冬秋夏,不符合日常对顺序的认识。
为改变筛选器的顺序,可构建一个顺序表,用于自定义顺序,在主页中点击转化数据。
点击输入数据,按照顺序输入春夏秋冬。
建立关系,商品销售表和季节顺序表建立了多对一的关系。
建立好关系后,在季节顺序表中,选择按列排序中的顺序,从而将筛选器的顺序变得与常规的认识一致。
构建基本图表元素后,对图表美化,调整合适的位置和大小,选择卡片图,设置需要重点突出的数据指标,再加上标题就可以收工了,绘制完成的帕累托图形如下所示。