Tableau 优课堂 | 第83课:Tableau Prep 联接步骤

published: 2024-04-16

欢迎观看由优阅达制作的【优课堂】系列视频。本节课,我们来学习: Tableau Prep 联接步骤。


创建联接步骤

通过在 Tableau Prep 中创建联接步骤,可以帮助你通过基于一个或多个共同字段名称,来引入新的字段或列,从而将两个表的数据组合为一份数据表。

例如,我们有一份国内超市的“订单”数据,想基于产品添加新字段,那么可以将这份数据通过共同字段(如产品 ID),与“产品”表的数据联接起来。

在 Tableau Prep 中如何操作呢?首先需要两个输入或清理步骤进行联接。在此,我们以清理步骤的联接举例,即 “订单” 表的“清理1”步骤和 “产品”表的“清理2”步骤。

我们可以简单将一个步骤拖放到另一个步骤上,然后选择 “联接”阴影区域。如拖动“清理2”,并将其放到“清理1”的联接阴影区域,即可添加联接步骤。

另外一种联接方法是:单击任意清理步骤后面的 “+” 图标,并选择添加 “联接” ,然后将需要联接的流程拖到“添加”阴影区域即可。

在本例中,单击“清理1”步骤右侧的“+”号并选择“联接”,将出现一个新的联接流程。

然后,将“清洁2”步骤拖到这个联接步骤的“添加”区域。最后,单击“联接”流程,在下方配置窗格中添加联接子句(即共同字段,如产品 ID)即可。

如果想为这个步骤命名,双击联接流程下方的名字,即可重命名为“添加产品类别”。


联接配置窗格

当创建联接步骤时,下面的配置窗格显示了大量关于联接的信息。

在窗格最左侧,我们可以看到“已应用联接子句”。默认情况下,Tableau Prep 基于两个联接表中的共同字段,定义为第一个联接子句。

也可以通过单击右上角的“+”号,并选择字段来添加另一个联接子句。

同时,支持修改操作符(如 = 和 >= )。

还可以通过单击 “X” 号来删除联接子句(注意,当鼠标悬停时 “X” 号才会出现)。

下方,可以看到联接类型。因为我们是将产品表的“清理2”步骤拖拽到订单表的“清理1”步骤上,而被拖拽的步骤会被放置在右侧,正如在这里看到的一样。

我们可以单击联接图形的某些部分来更改联接类型(左连接、右联接等)。然后,在“联接结果汇总”中,摘要条形图会显示不同的联接方式会包含或排除了哪些记录。

在本例中,内部联接的结果为 4009 行。可以看到,订单表(“清理1”步骤)中有 4003 行,产品表(“清理2”步骤)中有 1165 行与之匹配,这是因为产品表的信息可以出现在多个行中。

同时,产品表中有 99 行无法与订单表相匹配,因此被排除。

如果我们将联接类型从“内部”切换为“左侧”,那么联接结果显示为 4010 行数据。

这是因为在订单表(“清理1”步骤)中,“产品 ID ”字段列的所有值都默认纳入“已包括”的范畴,这意味着之前被排除的值虽然没有同时存在于两个表中,也能最终出现在联接结果中。

想要处理这个不匹配的值,我们可以单击联接结果汇总中的条形(如“不匹配的值”、”匹配值”或”联接结果”)进行查看,并在右侧”联接子句”窗格中进行手动修改。


修改联接子句

在“联接子句”窗格中,显示了两个表中共同字段的所有值。其中,红色值表示不同数据源之间没有匹配上的值;黑色值表示已匹配的值。

让我们勾选“仅显示不匹配值”,仅查看联接子句中不匹配的红色值。

经过检查发现,在这两个表的“产品 ID”列中,左侧的 “FUR-100005” 和右侧的“FUR-10005”应该是同一个值,但左侧多了一个“0”。

我们双击左侧的值,删除一个 0。修改后,匹配成功。

如果在“联接”步骤之后新增一个“清理”步骤,会在联接结果中看到两个表的共同字段名称被附加 “-1”, 用以区分新字段。

本例中,我们不需要来自 “产品” 表的“产品 ID”、“产品名称”和“产品包装”字段,所以可移除它们。按住 Ctrl 键(或 Cmd 键)同时选中这些字段,然后单击配置窗格顶部的“...”图标,打开菜单,选择“移除字段”选项。

现在,我们就得到了一份已完成联接的整洁数据。



以上就是关于「Tableau Prep 联接步骤」的全部内容。感谢观看本视频,更多 Tableau 学习资源,请持续关注优阅达大数据生态。


更多相关信息,请访问专题页: Tableau使用入门教程