数创学院 | Tableau 微课堂(5):Tableau Prep Builder 入门「Creator」

published: 2023-10-09

今天,我们一起来学习 Creator 角色的第 5 课:Tableau Prep Builder 入门,带你了解如何快速地合并多个数据表,调整、清理数据和输出结果。

为便于大家更好地跟随操作,接下来,小 C 把视频的内容用图文形式进行拆解。


更快地合并、塑造和清理数据

Tableau Prep Builder 提供了一种现代的数据准备方法,可以更轻松、更快速地组合、调整和清理数据,以便在 Tableau 中进行分析。通过提供可视化的直接路径来准备数据,你只需单击几下即可获得高质量的数据。

1连接数据

首先,连接到数据集,选择自 2 月 28 日起美国书商协会畅销书排行榜的数据源。在连接窗格中,我们看到数据集中的表格或制表符列表,拖入一个表格,现在我们已经在流中迈出了第一步。

之后,导入文件中的每一张表,通过使用通配符联合,留下空白的匹配模式。在右边我们可以看到一个字段列表,从这些表格上了解基础信息。

在工作流窗格的上方,通过双击来重命名这个步骤,输入一个名字,称之为 2 月 28 日。

2、清理数据

在流中添加另一个步骤,点击加号按钮,选择清洁步骤,就可以看到数据的状态,以及我们可能需要做些什么来清理它。

流面板下面,可以看到概要窗格和数据网格。配置文件窗格为每个选项显示一张卡片。数据集中的字段,卡片显示每个字段中的值以及分布信息。关于每个值出现的频率,通过点击一个栏,可以在其他领域突出相关的价值。

info 字段包含多条信息,在一栏中,如果我们往下看数据网格,可以看到这个字段有一个管道在标题和作者之间,然后在价格前面加一个美元符号,一根管子和国际标准图书编号。

我们可以把这些值分开,变成我们想要的唯一列,进行分析。点击卡片,打开菜单,这里有多种清洁选择,选择自动分割。Tableau Prep 很聪明,可以识别公共分隔符,即使他们是不同的。

我们把这些分成四列,重命名新字段只需双击一下字段名称,然后输入想要的名字。

我们不再需要原来的 info 字段,所以可以移除它;也可以拆分这个字段,然后删掉原来的。

现在我们有了不同的列,Price 目前是一个字符串数据类型,但它应该是一个十进制数,我们可以点击数据类型图标,并选择“数字十进制”。

3、合并数据

我们还有其他时间的数据,把它们加到流中。连接一个新的数据,它可以来自任何平台,但我们的恰好是另一个 Excel 文件,拖一个表格进来,选择通配符联合,现在我们有了第二个数据源。

将流程中的两个步骤结合起来,只需将一个拖到另一个上,然后选择 join 或 union。这里我们有相同的列结构,就直接选择 union。

现在明确了清洁步骤需要应用于联合后的结果,不仅仅是第一个数据集。所以,可以右键单击这条线并选择删除,然后将联合步骤拖到清洗步骤,这就是可以将清洁应用于全部数据源了。

4、输出数据

当数据已经准备好,可以使用时,创建一个输出步骤,单击加号并添加一个输出,选择 .CSV 格式,还可以选择在哪里保存文件,给文件起个新名字。

现在,当我们运行流时,就会生成一个新文件。Tableau Prep 不会直接返回到原始数据源,这个新文件包含了清理和合并后的所有数据。


以上就是关于「Tableau Prep Builder 入门」的全部内容。感谢观看本视频,更多 Tableau 学习资源,请持续关注 DCC 数创院。


更多相关信息,请访问专题页: Tableau使用入门教程