举个栗子!Alteryx 技巧(12):使用查找替换工具实现左连接
在实际分析场景中,用户经常需要连接不同数据源的数据。那么你知道吗?有时使用“查找替换工具”比使用“连接工具”和“合并工具”可以更快地实现左连接。
内连接:指仅根据两个数据集中相同的列(也称为主键,如账号或客户 ID 字段)提取左表和右表中的数据。如果你对两个电子表格执行 VLOOKUP,那么内联接是 VLOOKUP 的结果,不包括 #N/A 值。
左连接:指从内部联接引入数据,并从左表引入在右表中没有相应的数据(如帐号或客户 ID )。而左连接的结果包括 #N/A 值。
本期《举个栗子!Alteryx 技巧》,我们就来分享如何使用“查找替换”工具实现左连接!
具体步骤如下:
1、以超市数据为例,这里有两张表。左表是区域和类别的数据,右表是区域和子类别的数据。那么,怎样才能把右表的子类别栏放在左表的类别旁边呢?
2、使用连接工具来连接这两个表,再从右表中删除重复的区域列。
3、将合并工具拖入画布,并使其连接 J 输出锚。点击右上角的运行按钮,从结果可知,J 输出锚只组合了区域、类别和子类别的内连接数据。
4、那其他区域的数据呢?试着再从 L 输出锚点连接到合并工具。
点击右上角的运行按钮,从结果可知,不在右表中的区域数据则返回 Null 值。如果你在 Excel 中执行 VLOOKUP 函数,你也会看到这些 #N/A 值。
5、除此之外,你也可以使用查找替换工具返回相同的结果,而不是使用连接、合并工具。在相同的数据的情况下,将查找替换工具拖入画布,匹配相同的字段(区域),选择附加字段到记录(子类别),即可快速实现左连接。
PS:这两种方法得到的数据顺序是不同的。如果希望结果按既定的顺序排列,则需要另外添加排序工具。
今天的 Alteryx 技巧,你 Get 到了吗?
赶快打开电脑试试看吧~