Tableau 优课堂 | 第30课:其他筛选主题
欢迎观看由优阅达制作的【优课堂】系列视频。本节课,我们来学习:其他筛选主题。你可以下载本视频所用数据集同步实操。
在 Tableau 中,筛选器是非常强大的,但同时也非常复杂。如果你已经对筛选器有了基本理解,那么本期优课堂,将介绍一些有关筛选器的更深层的概念。
上下文筛选器
首先是上下文筛选器。有一点需要注意的是,筛选器选项卡上的筛选器都是独立计算的。
如果一个给定的筛选器会精简数据集,那么它适合添加到上下文中。
上下文筛选器将优先计算,其他筛选器则基于它的计算结果,再运行其筛选计算。
例如,我们只想查看器具子类别中的产品,右键单击“子类别”筛选器,并选择“添加到上下文”来将其作为上下文筛选器。
可以看到,筛选器胶囊由蓝色变成了灰色,那么任何后续的筛选器都将基于器具产品的数据运行。
当要求筛选器返回的结果集要小得多时,使用上下文筛选器是最好的选择,因为其运行准则是筛选至原始数据的十分之一或更少。
理想情况下,上下文筛选器不应该被频繁更改。所以,我们单击视图右侧“子类别”筛选器的下拉菜单,选择“隐藏卡”。
应用于工作表
当胶囊被放置在“筛选器”卡上时,默认情况下该筛选器仅应用于当前工作表。
如果想要更广泛地应用筛选器,可以单击胶囊的下拉菜单,选择“应用于工作表”。可以看到 Tableau 提供了几个选项来更改筛选器的应用范围: “使用相关数据源的所有项” 、 “使用此数据源的所有项” 或 “选定工作表” 等。
这在仪表板上尤其有用。在仪表板上,可以将与多个视图相关的筛选器,设置为同时应用于所有视图或其中的部分视图。
默认情况下,交互筛选器只应用于已设置应用的视图。但当我们更改“类别”筛选器的值时,就会看到:只有一张视图出现了筛选联动。
如果单击筛选器的下拉菜单,选择“应用到工作表”>“使用此数据源的所有项”。现在,当更改筛选器值时,可以看到相关视图都可进行筛选。
不仅仅是仪表板上的视图。现在,我们构建一个新的工作表。先后双击 “销售额” 和 “类别” 字段。
在视图中,我们发现仅有一个类别显示。但幸运的是,在筛选器选项卡上可以看到一个视觉指示,这说明应用了筛选器。
这个图标旨在让你知道:数据连接上应用了一个筛选器。所以,如果这不是我们想要的效果,可以回溯并找到它。
需要注意的是,将 “应用到所有工作表” 的筛选器从“筛选器”卡移除时,会将其从所有视图中移除,并不只是当前看到的视图。所以,我们进行移除操作时,请务必小心。
筛选器设置方式
为了能够精确地控制筛选的内容和方式,理解筛选设置方式非常重要。
假设我们想对销售额超过 40000 的客户进行营销推广。一个简单的方法是:通过销售额建立一个客户视图,就像下图显示的那样。
然后对销售额的总和值进行筛选,方法如下:
将“销售额”字段拖入“筛选器”。此时,视图上会弹出“筛选器字段”对话框。在筛选方式列表中,选择“总和”,单击“下一步”按钮;在新弹出的“筛选器”对话框中,选择“至少”,并在值范围中输入40000,最后单击确定。
让我们上下滚动视图,视图看起来是正确的。但是,销售额>40000的筛选器取决于视图的结构。
如果修改视图,就有可能改变筛选器的应用方式。我们从窗口底部可以看到,此视图有 67 行标记,这表示有 67 个客户符合我们的营销条件。
但如果将“类别”字段添加到“标记”卡的颜色时,就会突然减少到 6 行。这是为什么呢?被筛选掉的 61 名客户在同一类别中的销售额并没有超过 4万元,即使他们可能符合全部条件。
Tableau 通过筛选器运行每个标记,在这个视图中,每个客户每个类别都有一个标记。
试试另一种做法。将 “客户 ID” 字段拖到“筛选器”卡,在弹出的“筛选器”对话框中,选择 “条件” 选项卡,然后选择按字段筛选,条件输入:销售额 大于等于 40000。最后单击确定。
此时,视图上就筛选出了销售额>40000元的客户。
与第一个方法一样,视图筛选出了 67 行标记。但如果再次把“类别”字段添加至“标记”卡的颜色中,标记数量仍然保持在 67 行,并没有像上个方法那样被筛选掉。
由此可见,无论类别如何划分销售额,Tableau 都会通过筛选器计算客户的销售总额,然后将所有销售额>40000的客户纳入视图。
以上操作,让我们认识到:不同的筛选器设置方式对可视化的影响,并该如何根据我们的需求把控筛选器的设置。
筛选应用优先级
筛选器在“筛选器”卡中的顺序,对发送到数据源的查询并无影响。因为,筛选器是被分组到 WHERE 查询子句中的。
然而,筛选器是按固定优先级执行的(如下图所示)。
排名首位的是数据提取筛选器,会限制带入什么数据进行数据提取,但仅在使用数据提取时可用。而应用数据源筛选器,将限制整个数据源在 Tableau 中可用的范围,它是实时连接中可用的最高级别筛选器。
当数据进入 Tableau 后,将首先应用上下文筛选器,所有后续筛选器的运行都要基于其输出的数据源查询。
接下来是计算中包含 FIXED 表达式(LOD)的筛选器。
下一级是对维度进行筛选,如 “邮寄方式”。
随后是 INCLUDE或 EXCLUDE 详细级别的筛选器。
然后是度量筛选器,如”销售额“”。
最后是表计算筛选器,因为这些仅对视图中的数据执行。
性能和筛选查询
低效的筛选器是导致工作簿和仪表板性能低下的最常见原因之一。
我们应该综合考虑每一种筛选方式对性能的影响,比如:因为需要在后台创建临时表,上下文筛选器的创建或更改速度很慢。但一旦创建成功,就可以提高性能,因为进一步的查询是在数据子集上运行,而不是整个数据集。
级联交互筛选器可以帮助缩小选项列表的范围。比如下图,我们只看到所选省份的数据。
然而,当筛选器要求 Tableau 查找所有可能的字段值时,就需要一个复杂的查询,这需要耗费时间进行计算。
在这里,单击“产品 ID”筛选器的下拉小三角,在弹出的菜单中,选择“通配符匹配”选项,通过模糊筛选可能会加快性能。数据源中索引的存在和维护可以显著提高筛选性能。
以上就是关于「其他筛选主题」的全部内容。感谢观看本视频,更多 Tableau 学习资源,请关注微信公众号“优阅达大数据生态”。