刷新数据提取
- 版本 :2022.1 及更高版本
适用于: Tableau Desktop
当原始数据发生改变时,您可以使用桌面刷新数据提取,方法是在“数据”菜单中选择数据源,然后选择 。可以将数据提取配置为完全刷新,从而将所有数据替换为原始数据源中的数据;或者配置为增量刷新,仅添加自上次刷新以来新增的行。
注意:您还可以使用 Tableau 数据提取命令行实用工具自动执行数据提取刷新。有关详细信息,请参见Tableau 数据提取命令行实用工具。
刷新数据提取之前
如果要刷新数据提取,请在执行数据提取刷新之前记下数据提取的文件格式。如果使用版本 2022.1 对 .tde 数据提取执行刷新,则该数据提取会自动升级为 .hyper 数据提取。虽然升级到 .hyper 数据提取有许多好处,但是您将无法使用以前版本的 Tableau Desktop 打开数据提取。有关详细信息,请参见数据提取升级为 .hyper 格式。
配置完整的数据提取刷新
默认情况下,数据提取被配置为完全刷新。这意味着每次刷新数据提取时,所有行都会替换为原始数据源中的数据。虽然这种刷新可确保您具有原始数据中的数据的精确副本,但在数据库上执行完全刷新有时需要很长时间并且开销很大,具体取决于数据提取的大小。如果未将数据提取配置为增量刷新,则选择刷新数据提取将会完全刷新数据提取。
发布到 Tableau Server
如果您打算将数据提取作为数据源发布到 Tableau Server,则可以在发布期间指定数据提取刷新计划。
同样,如果您要将工作簿中的数据提取发布到 Tableau Server,则也可以在发布期间指定数据提取刷新计划。有关详细信息,请参见发布工作簿时计划数据提取刷新。
发布到 Tableau Online
如果打算将数据提取以数据源形式发布到 Tableau Online,则用于刷新数据的选项取决于您的数据源的特征。有关刷新特定数据源中的数据的详细信息,请参见按数据源列出的数据提取刷新选项。
配置增量数据提取刷新
大多数数据源都支持增量刷新。您可以将刷新配置为仅添加自上次提取数据以来新增的行,而不是刷新整个数据提取。例如,您可能有一个每天都使用新销售交易进行更新的数据源。您只需添加当天发生的新交易,而不是每天重新生成整个数据提取。随后,为了确保拥有最新数据,您可能需要每周执行一次完全刷新。
注意:如果源数据的数据结构发生更改(例如,添加了新列),则需要执行完全数据提取刷新,然后才能再次开始执行增量刷新。
你可以按以下步骤将数据提取设置为增量刷新。
在“数据”菜单中选择数据源,然后选择“提取数据”。
在“提取数据”对话框中,选择“所有行”作为要提取的行数。只有在提取数据库中的所有行时,才能定义增量刷新。不能将样本数据提取递增。
选择“增量刷新”,然后在数据库中指定将用于标识新行的列。例如,如果选择“日期”字段,则刷新将会添加日期晚于上次刷新日期的所有行。或者,也可以使用“ID”列,该列将随添加到数据库中的行而递增。
注意:每次刷新数据提取时,完全刷新都会用原始数据源中的数据替换所有行。完全刷新可能需要更长的时间,并且对数据库来说代价高昂。
注意:数据引擎是 Tableau 创建数据提取所使用的基础机制,存储时间值时最多精确到 3 位小数。如果为“使用列标识新行”指定日期时间或时间戳列,并且数据库使用比 Tableau 更高的精度,则在增量刷新后最终会出现重复行。举例来说,如果数据库有两个行,其中一个行的日期时间值为
2015-03-13 17:30:56.502352
,另一个行的日期时间值为2015-03-13 17:30:56.502852
,则 Tableau 在存储这两个行时都将使用日期时间值2015-03-13 17:30:56.502
,从而会创建重复行。完成后,单击“数据提取”。
上述步骤可用于定义新数据提取,或者用于针对增量刷新编辑现有数据提取。如果要编辑现有数据提取,则将显示上次刷新,这样您可以确保使用正确的数据更新数据提取。
参阅数据提取历史记录
您可以查看刷新数据提取的历史记录,方法是在“数据”菜单中选择数据源,然后选择 。
“数据提取历史记录”对话框将显示每次刷新的日期和时间、该刷新是完全刷新还是增量刷新以及所添加的行数。如果刷新是从文件执行的,则还将显示源文件的文件名。