优阅达 | Tableau 微课堂(97): Explain Data

published: 2023-05-08

Explain Data

Explain Data 通过简单的点击即可自动为数据值提供由 AI (人工智能)驱动的解释。它采用高级统计模型,以 Tableau 可视化形式为你感兴趣的特定数据点提供具有侧重性的交互式解释。不仅节省时间,还可以帮助你发现更深入的见解。

Explain Data 可以在 Tableau Desktop、Tableau Server、Tableau Online 和 Tableau Public 中使用,限具有 Creator 和 Explorer 访问权限的用户可用。

场景描述

演示工作簿中有伦敦房屋销售的数据,视图中显示了按行政区划分的平均住房拥有期限。

大多数行政区的平均住房拥有期限超过 5 年。然而,Newham 区是个例外,平均住房拥有期限只有 4.8 年。

下面,使用 Explain Data 来探索:为什么 Newham 区的房屋销售比其他行政区更频繁?

启动 Explain Data

要使用 Explain Data,必须在编辑视图时先选中单个标记进行分析。分析视图中必须包含一个用 Sum、Avg、Count 或 Count Distinct 聚合的度量值。

在示例场景中,单击表示 “ Newham 区平均拥有房屋期限” 的标记。然后单击工具提示中的 “ Explain Data ”(小灯泡) 图标。

还可以从菜单栏的 “分析” 中启动 “数据解释” 。或者右键单击标记,在弹出的对话框中选择 “数据解释” 选项。

数据解释窗口

数据解释窗口显示了我们所选的标记名称、使用中的度量和预期值概要。

这些信息证实了 Newham 区的平均住房拥有期限低于预期,不属于自然变化范围。
在左下区域,可以看到预期值总结了几种可能的解释。这些解释是根据它们的信息量多少的顺序排列的。这些解释基于数据源的所有维度和度量,而非仅仅是探索视图中显示的标记。

在右边,可以看到解释的描述是由 Tableau 自然语言语句和 Tableau 视图组合而成。

解释说明

解释一

第一种也是最有用的解释是,Newham 区存在独特的记录比例,居住群体以年轻族群为主。

在解释描述中,图表中的蓝色柱形代表 Newham 区,而灰色柱形代表地图中的其他所有区。Y 轴代表房屋销售总量的百分比。

从灰色条形中得知,在伦敦所有的行政区中,有年轻人群体的行政区的房屋销售比例较低。与此同时,蓝色条形告诉我们,在伦敦的 Newham 区,年轻人群体社区的房屋销售比例更高。
当向下滚动时,可以看到整个伦敦年轻人群体的平均房屋拥有时限略低于其他类别的群体。然而,这一平均值仍然低于 Newham 区的 4.8 。

让我们来探索另一种解释,以便进一步了解异常值。

解释二

第二种解释是关于住房支付能力的群体。同样,Y 轴代表房屋销售总量的百分比。

从蓝色条形中得知,与伦敦整体相比,Newham 区在超低住房支付能力群体中占有很高的房屋销售比例。

解释三

第三种解释是关于平均年龄。平均年龄为 32 岁时,Newham 区的房屋销售比例高于伦敦的整体水平。在其他平均年龄,Newham 区的房屋销售比例低于伦敦整体水平。

解释四

第四种解释表明:在 Newham 区,几乎所有的房屋销售都发生在那些没有退休的人身上。

分析流程

Explain Data 有助于进一步探索。解释描述中的每个视图都可以作为新工作表打开以便进一步分析。

点击打开 “退休人口百分比的价值分布” 视图,即可作为一个新的工作表进行更深入的探索。把列上的 “% of Population that is Retired” 胶囊替换成维度 “Median Age”字段。

我们发现 Newham 区所有的房屋销售都是在相对年轻的人群中进行的。一般来说,年轻人的流动性很强,比老年人更频繁地搬家。

这或许有助于解释为什么 Newham 区的平均房屋拥有期限低于伦敦其他地区了。

结语

分析始于使用 Explain Data 询问:为什么 Newham 区的房屋销售频率高于伦敦其他地区?Explain Data 分析了整个数据集,可从中快速发现数据之间的关系。然后,使用这些见解来帮助和指导我们深入探索数据,获取更多洞察。

本节 Tableau 微课堂到此结束,感谢你的耐心阅读。

下节课,我将带你学习了解 Ask Data 。