Tableau 优课堂 | 第83课:Tableau Prep 联接步骤
欢迎观看由优阅达制作的【优课堂】系列视频。本节课,我们来学习: Tableau Prep 联接步骤。
创建联接步骤
通过在 Tableau Prep 中创建联接步骤,可以帮助你通过基于一个或多个共同字段名称,来引入新的字段或列,从而将两个表的数据组合为一份数据表。
例如,我们有一份国内超市的“订单”数据,想基于产品添加新字段,那么可以将这份数据通过共同字段(如产品 ID),与“产品”表的数据联接起来。
在 Tableau Prep 中如何操作呢?首先需要两个输入或清理步骤进行联接。在此,我们以清理步骤的联接举例,即 “订单” 表的“清理1”步骤和 “产品”表的“清理2”步骤。
我们可以简单将一个步骤拖放到另一个步骤上,然后选择 “联接”阴影区域。如拖动“清理2”,并将其放到“清理1”的联接阴影区域,即可添加联接步骤。
另外一种联接方法是:单击任意清理步骤后面的 “+” 图标,并选择添加 “联接” ,然后将需要联接的流程拖到“添加”阴影区域即可。
在本例中,单击“清理1”步骤右侧的“+”号并选择“联接”,将出现一个新的联接流程。
然后,将“清洁2”步骤拖到这个联接步骤的“添加”区域。最后,单击“联接”流程,在下方配置窗格中添加联接子句(即共同字段,如产品 ID)即可。
如果想为这个步骤命名,双击联接流程下方的名字,即可重命名为“添加产品类别”。
联接配置窗格
当创建联接步骤时,下面的配置窗格显示了大量关于联接的信息。
在窗格最左侧,我们可以看到“已应用联接子句”。默认情况下,Tableau Prep 基于两个联接表中的共同字段,定义为第一个联接子句。
也可以通过单击右上角的“+”号,并选择字段来添加另一个联接子句。
同时,支持修改操作符(如 = 和 >= )。
还可以通过单击 “X” 号来删除联接子句(注意,当鼠标悬停时 “X” 号才会出现)。
下方,可以看到联接类型。因为我们是将产品表的“清理2”步骤拖拽到订单表的“清理1”步骤上,而被拖拽的步骤会被放置在右侧,正如在这里看到的一样。
我们可以单击联接图形的某些部分来更改联接类型(左连接、右联接等)。然后,在“联接结果汇总”中,摘要条形图会显示不同的联接方式会包含或排除了哪些记录。
在本例中,内部联接的结果为 4009 行。可以看到,订单表(“清理1”步骤)中有 4003 行,产品表(“清理2”步骤)中有 1165 行与之匹配,这是因为产品表的信息可以出现在多个行中。
同时,产品表中有 99 行无法与订单表相匹配,因此被排除。
如果我们将联接类型从“内部”切换为“左侧”,那么联接结果显示为 4010 行数据。
这是因为在订单表(“清理1”步骤)中,“产品 ID ”字段列的所有值都默认纳入“已包括”的范畴,这意味着之前被排除的值虽然没有同时存在于两个表中,也能最终出现在联接结果中。
想要处理这个不匹配的值,我们可以单击联接结果汇总中的条形(如“不匹配的值”、”匹配值”或”联接结果”)进行查看,并在右侧”联接子句”窗格中进行手动修改。
修改联接子句
在“联接子句”窗格中,显示了两个表中共同字段的所有值。其中,红色值表示不同数据源之间没有匹配上的值;黑色值表示已匹配的值。
让我们勾选“仅显示不匹配值”,仅查看联接子句中不匹配的红色值。
经过检查发现,在这两个表的“产品 ID”列中,左侧的 “FUR-100005” 和右侧的“FUR-10005”应该是同一个值,但左侧多了一个“0”。
我们双击左侧的值,删除一个 0。修改后,匹配成功。
如果在“联接”步骤之后新增一个“清理”步骤,会在联接结果中看到两个表的共同字段名称被附加 “-1”, 用以区分新字段。
本例中,我们不需要来自 “产品” 表的“产品 ID”、“产品名称”和“产品包装”字段,所以可移除它们。按住 Ctrl 键(或 Cmd 键)同时选中这些字段,然后单击配置窗格顶部的“...”图标,打开菜单,选择“移除字段”选项。
现在,我们就得到了一份已完成联接的整洁数据。
以上就是关于「Tableau Prep 联接步骤」的全部内容。感谢观看本视频,更多 Tableau 学习资源,请持续关注优阅达大数据生态。