Tableau 优课堂 | 第78课:Tableau Prep 清理步骤
欢迎观看由优阅达制作的【优课堂】系列视频。本节课,我们来学习: Tableau Prep 清理步骤。
清理步骤简介
受众多因素影响,数据可能无法直接进行分析。除了对数据进行转置、聚合,以及通过联接或并集组合数据,你还需要执行一些其余的清理操作。
Tableau Prep 中的数据清洗是通过流程中的清理步骤完成的,涵盖了移除字段、更改数据类型和创建计算字段等内容。
想要创建一个清理步骤,只需选择要清洗的流程阶段,单击“+”号图标,并选择“清理步骤”。
此时,Tableau Prep 会默认生成一个清理步骤,它在流程中显示为一个横条。当处于一个清理步骤时,下面的窗口会显示“概要窗格”和“数据网格”。
在“概要窗格”中,数据中的每个字段表示为一张卡片。我们可直接在卡片上通过操作实现字段重命名或更改数据类型。如果打开一张卡片的下拉菜单,将会看到更多其他选项。
接下来,让我们逐一查看各选项:
探索清理步骤选项
移除字段
首先,这个“Table Names”字段是并集后自动生成的,本例中并不需要它。因此,我们只需单击选中卡片并打开下拉菜单,选择“移除”选项。
自动拆分
我们注意到,“省份-城市”字段明显是由两个字段合并组成的,现在需要将其拆分成独立的字段,以便后续的地理可视化分析。
单击打开卡片的下拉菜单,选择“拆分值”选项。这里,Tableau Prep 提供了两种拆分方法。
相比于自动拆分,自定义拆分提供了分隔符与字段拆分次序等详细选项,可供你灵活调整拆分规则。在本示例中,我们选择“自动拆分”。
拆分后的字段会自动移动到“概要窗格”的最前面。此时,可以看到两个新字段“省份-城市 - 拆分 1”和“省份-城市 - 拆分 2”。
重命名字段
为了避免混淆,我们需要分别双击这两个字段,并将其重命名为“省份”和“城市”。然后,移除原始字段“ 省份-城市 ”。
需要注意的是,在 Tableau Prep 中,即使字段用于计算或拆分,也可以删除它们。
清理选项
对于部分字段包含其它内容的情况,我们可以使用一些 Tableau Prep 内置的快速清理选项来解决。
以“产品 ID”字段举例,它由英文字符、分隔符与数字编码组成。在本例中,我们需要将“产品ID”还原为纯数字的值。
因此,我们单击打开下拉菜单,选择“清理”选项。这里提供了一些可用于加快常见数据清洗过程的选项。首先,我们选择“移除字母”选项。
再次打开下拉菜单,选择“清理”-“移除标点符号”选项。
现在,“产品 ID”就只剩下数字了,这就是我们想要的效果。
更改数据类型
再来看看“Order ID ”这个字段,Tableau Prep 将其数据类型识别为数字,但我们可以重新将其数据类型设置为字符串。
方法是单击代表数据类型的图标,在弹出菜单中,将当前数据类型从数字(整数)改为字符串。可以看到,数据类型图标改成了字符串样式。
筛选器
Tableau Prep 中的筛选器功能,会因字段的数据类型不同,而呈现出不同的筛选项。例如在对日期类型字段应用筛选器时,我们可以按照“日期范围”或“相对日期”进行筛选。
实际上,对于大多数字段类型,筛选器是通过编写计算来完成的。例如,我们希望数据中只呈现做“小本生意”的客户。
具体操作方法是,单击选中“客户类型”字段卡并打开下拉菜单,选择“筛选器”-“计算”选项。然后,在编辑器中输入公式:[客户类型]='小本生意',保存后即可应用筛选。
若要删除筛选器,可展开“概要窗格”左侧的“更改数”列表,然后删除这一步骤。
分组和替换
此外,我们也可以将字段值按照一定规则进行分组,以便统一显示值。例如“省份”字段,值列表中的“广东”和“广东省”显然是同一个内容。
具体操作方法是:单击打开“省份”字段卡的下拉菜单,选择“将值分组”选项,这里提供了几种分组方式。在本例中,我们选择“手动选择”选项。
在弹出的窗口中,按住 Ctrl 键(Mac 为 cmd 键)同时选中值“广东”和“广东省”,然后单击窗口右侧的“将值分组”按钮即可。
同样方法可以对其他值分组。分组完成后,单击窗口右上角的“完成”按钮,即可应用分组。
清理步骤的注释和更改数
在清理步骤中,我们很容易忘记做过什么,因为包含了很多不同类型的操作。
不用担心,Tableau Prep 会自动记录操作,并将注释添加到处理过的卡片中;同时,流程中的清理步骤将通过注释显示所做的操作,并通过图标显示清理类型。
更强大的功能是,左侧的“更改数”列表显示了该步骤中所有操作的历史记录。
如果想撤销某个特定的更改,比如移除这个字段,我们可以删除它,而不会丢失之后的操作。如果想修改一个计算,可以在“更改数”列表中右键单击此步骤,选择“编辑”。
请注意,当点击返回到一个变更时,将返回到当个步骤的数据。所以,要查看在清理步骤中所做的全部操作,需要单击最后一个更改。
为了保持流程的条理性,可以在任何时候创建一个清理步骤。从一个没有任何注释和更改的初始步骤开始,以便我们在单个步骤中执行相关清理操作,来连接其他操作步骤。
以上就是关于「Tableau Prep 清理步骤」的全部内容。感谢观看本视频,更多 Tableau 学习资源,请持续关注优阅达大数据生态。