Tableau 优课堂 | 第65课:聚合、粒度与比率计算

published: 2023-07-11

欢迎观看由优阅达制作的【优课堂】系列视频。本节课,我们来学习:聚合、粒度与比率计算。

Tableau 中经常需要计算比例或比率。但是,如果我们只是创建这些计算字段,却不理解 Tableau 如何计算得出我们的答案,那么很容易得出错误结果。


粒度与聚合

首先,让我们先复习两个重要概念:粒度与聚合。

如果要绘制利润和销售额的对应关系,分别双击“利润”和“销售额”字段,那么视图中只能得到一个点。

Tableau 对利润与销售额进行了聚合,然后绘制出图表。利润总和与销售额总和分别是利润和销售额的聚合值,该值取决于视图的详细程度,即粒度。

如果我们希望视图中显示更多标记,就需要更改粒度,也就是视图的详细程度。

通过向视图中添加维度,即可增加粒度。比如,将“细分”字段拖拽至“标记”卡的颜色上,可将单个标记点分为三个点。每个点表示在各个细分项下,利润总和与销售额总和的对应关系。

将“地区”字段拖放至“标记“卡的大小,那么视图中就有 18 个标记,现在每个地区的每个细分项各有一个点表示。

在”标记”卡中将地区字段的“大小”改为“形状”或其他标记类型后,并不会改变视图的粒度,还是有 18 个标记。

每个标记代表了每个地区的每个细分项下,利润总和与销售额总和的对应关系。

比如,这个标记表示地区值为华东,细分值为消费者的情况下,利润总和与销售额总和的对应关系。


“详细信息”功能区

通过使用“标记“卡中的详细信息,我们无需按颜色、大小或形状对字段进行编码,就能影响视图的粒度。

让我们来看看,将“客户 ID”字段置于“标记”卡的详细信息上,会发生什么变化。

可以看到,形状和颜色的种类并没有增加,但是标记数量大幅度的增加了。

每个标记点分别代表了每个具体的“细分”、“地区”和“客户 ID”组合下,利润和销售额的对应关系。这说明粒度发生了变化。


计算中的聚合

为什么在讨论计算利润率前,我们先要复习聚合和粒度的概念呢?那是因为,Tableau 的计算方式取决于数据的聚合,因此取决于视图的粒度。

请看下图这样一个二维表格。在这里,Tableau 汇总了每个“类别”中所有订单的利润和销售额,并对每个类别显示一个值。

当下钻查询到“子类别”时,就会看到每个子类别的利润总和与销售额总和。再次单击下钻到“行 ID”时,就可以看到每一条单独的记录。


利润率计算

了解这一点后,我们来看一看如何计算利润率。

这里有两个计算字段,即“利润/销售额”和“总和(利润)/总和(销售额)”。为方便大家理解,公式就和名称显示的一样。

编辑“度量名称”筛选器,在对话框中勾选这两个字段,让它们显示在视图中。

当视图粒度处于“行ID”级别时,可以看到这两个度量值得出了相同答案。

但是当我们上钻,让视图粒度处于“子类别”级别时,度量值开始发生不可思议的变化。

两个计算得出的比率不匹配了,红色文本标记的“利润/销售额”字段,计算结果是非常大的数字。这是怎么回事呢?

当 Tableau 将“利润/销售额”计算聚合到视图的粒度时,其实是在汇总比率本身。

换句话说,Tableau 已经为每条记录计算了一个利润率,然后将这些比率汇总起来。这与我们想执行的操作大不相同。

相比之下,另一个“总和(利润)/总和(销售额)”的计算,是在视图的粒度条件下汇总利润和销售额,然后计算这两个数字的比率。

如果我们进一步上钻到“类别”级别,会发现绿色文本标记的比率仍然正确。

通过将聚合置于计算字段内部,我们可以让 Tableau 知道何时计算比率,无论视图的粒度如何都是如此。

  • 总的来说,“总和(利润)/总和(销售额)” 字段可按照任一视图粒度先进行利润和销售额的聚合计算,然后在计算结果的基础上计算比率。

  • 而 “利润/销售额” 字段是在最低粒度水平上计算利润率,然后将所有比率聚合计算到视图的粒度上。



以上就是关于「聚合、粒度与比率计算」的全部内容。感谢观看本视频,更多 Tableau 学习资源,请关注微信公众号“优阅达大数据生态”。


更多相关信息,请访问专题页: Minitab中文版入门教程