举个栗子!Tableau 技巧(84):使用盒须图查看你的数据分布
关于盒须图,英文:Box-plot,又称为箱形图、盒式图或箱线图,是一种用作显示一组数据分散情况资料的统计图。在各种领域经常被使用,较多用于品质管理。
如果你想显示一组数据的分布情况:例如:一目了然地理解数据,查看数据如何向某一段偏斜,查看数据中的异常值。建议使用盒须图,它是显示数据分布情况的重要方式。
盒须图,从名称上可以看出,这种图表包含两个部分:
盒,包含数据的中位数,以及第 1 和第 3 个四分位数(比中位数分别大、小 25%);
须,一般代表四分位距 1.5 倍以内的数据(第 1 和第 3 个四分位数之间差)。“须”也可用来显示数据内的最高和最低点。
例如下图:比较住房销售价格。在某一段时间,出售住房的中位价格以旧金山为最高,但洛杉矶的分布情况则更宽。实际上,洛杉矶最贵的住房销售价格数倍于中位数。
在很多分析工具里,盒须图的制作过程非常繁琐,经常令数据粉望而却步。但是,在 Tableau 的智能显示里,你可以直接选用盒须图,让数据呈现变得轻而易举!
这里,我们就来分享在 Tableau 中如何使用盒须图来查看你的数据分布。
本期《举个栗子》,阿达要给大家分享的 Tableau 技巧是:使用盒须图查看你的数据分布。
为方便学习,我们使用 Tableau 自带的超市数据。
具体步骤如下:
Step 1:创建图表
双击“销售额”和“产品类型”,默认生成了柱形图。
Step 2:选用盒须图
鼠标点击右上角,或通过快捷键 Ctrl+1(Mac用户:Command-1),打开“智能显示”,选择“盒须图”。
Step 3:双击“订单日期”
接着,双击“订单日期”,用盒须图来呈现订单数据。
最后,我们通过解读这个图表,来帮助你更好的理解盒须图。
通过上面的盒须图,可以大致得出以下数据结果:
不难发现:2017年的销售额最大值最高,2016年销售额的最小值最低;2017年的上枢纽接近等于2014年的最大值,但2017年的中位数确实整体来看偏低的,2016年的下枢纽最低,中位数最低。
更多建议:
- 隐藏盒内的点。这样可以帮助看图人专注于异常值;
- 在各个类别维度间比较箱形图。如需快速比较数据集之间的分布情况,箱形图就非常理想。
今天的 Tableau 技巧,你 Get 到了吗?赶快打开你的 Tableau,试试看吧!