Tableau 优课堂 | 第85课:Tableau Prep 输出步骤

发布于: 2024-05-15

欢迎观看由优阅达制作的【优课堂】系列视频。本节课,我们来学习: Tableau Prep 输出步骤。


流程文件格式

当构建一个流程时,如果我们不想直接输出数据集,可以保存为流程文件格式。

第一种,保存流程文件。通过菜单栏的“文件”-“保存”或“另存为”选项,默认将创建一个 .tfl 格式的文件。

它将存储关于流程本身的信息,如有哪些数据连接,数据清理过程中所作的更改等等,但不存储其他信息。

如果要保存原始数据集的流程和提取(只保存平面文件),可以选择保存为 .tflx 打包的 Tableau 流程文件 。

然而,若这两种文件都不是我们想要的最终数据源。要实际地将原数据推进流程中的各个步骤并生成一个符合清理预期的数据集,我们必须创建一个输出并运行流程。


输出步骤窗格

要添加输出步骤,只需单击前一步骤后的 “+” 号图标并选择添加输出,即可在流程中创建一个新步骤。下面将出现输出步骤的概览窗格,这就是可以进行输出配置的地方。

首先,输出保存有三种格式:文件、已发布数据源和数据库表。

如果选择保存为一个文件,我们需要先设置文件的输出类型:数据提取(.hyper),Excel 或 csv。比如,我们选择默认的数据提取(.hyper),然后单击“浏览”按钮 ,指定文件的保存地址。

可以看到,.hyper 文件会默认保存在本机的 “文档\我的 Tableau Prep 存储库\数据源”中。然后输入要保存的文件名,点击接受。

回到 Prep 的输出配置窗格,在底部的“完全刷新”选项中,选择默认的“创建表”。如果你之前曾经创建过同类型的 .hyper,需要在原基础上增加数据,则可选择“附加到表”。


运行输出流程

完成输出格式和存储位置的设置后,还需要运行流程。

这实际上是获取所有原始数据并将其放入流程中,以创建最终数据集的过程。只有在设置好输出并运行流程之后,才可以使用已清洗好的数据。

要重新生成或更新数据输出(例如,在向流程添加新数据之后),需重新运行流程。我们可以选择覆盖原始文件,或者重新命名来创建一个新的输出。


创建多个输出

一个流程可以包含多个输出步骤。在本期的示例中,如果想使用“数据并集”这一步的数据,可直接在此步骤后面添加一个输出。

流程分支后,可继续与后续的其他数据集连接,在整个流程的最后还有另一个输出。

我们可以独立地运行流程中的任何一个输出。如果我们希望每周输出数据并集的数据源,但每个月只生成一次最终数据集,那么这种操作将非常有用。


在 Tableau Desktop 中预览

如果不想创建一个输出步骤来导出数据使用,可以通过右键单击任一步骤并选择 “在 Tableau Desktop 中预览” ,以便我们检查进度。

这将把数据直接带到 Tableau Desktop 中。随后还可以在分析上下文中验证数据,并轻松地回到 Tableau Prep 中继续流程或生成输出。

请注意,在 Tableau Desktop 中预览的数据是抽样的,并非全量数据,不建议直接在此预览中直接进行最终业务分析哦~



以上就是关于「Tableau Prep 输出步骤」的全部内容。感谢观看本视频,更多 Tableau 学习资源,请持续关注优阅达大数据生态。


更多相关信息,请访问专题页: Tableau使用入门教程