在 Web 上创建数据提取
- 版本 :2022.1 及更高版本
您可以在 Web 中提取数据源(无需使用 Tableau Desktop),以提高数据源性能并支持其他分析功能。提取数据源时,Tableau 会将数据从远程数据存储复制到 Tableau Server 或 Tableau Online。
您可以在 Web 中提取数据源(无需使用 Tableau Desktop),以提高数据源性能并支持其他分析功能。提取数据源时,Tableau 会将数据从远程数据存储复制到 Tableau Server 或 Tableau Online。若要详细了解提取数据的好处,请参见提取数据。在 Web 中,您可以在 Web 制作过程中或内容服务器中提取。
在 Web 制作中创建数据提取
您可以在 Web 制作中使用默认数据提取设置直接创建数据提取。
在 Web 制作中提取嵌入式数据源
在 Web 制作中创建数据提取:
提示:建议在创建数据提取之前完成数据模型。数据提取创建可能需要很长时间,对数据模型的任何更改(例如添加新逻辑表)都将使数据提取失效。
单击 Web 制作窗格左下角的“数据源”选项卡。对于新的工作簿,您将在“数据源”选项卡中开始。
在右上角,将连接类型从“实时”更改为“数据提取”。
单击“创建数据提取”。您将看到“正在创建数据提取”对话框。
数据提取创建可能需要很长时间,您可以在创建数据提取时关闭制作会话。为确保数据提取创建不会丢失,请在对话框中单击“完成时通知我”以指定要保存的已提取工作簿的位置。如果数据提取成功,您的工作簿将保存到指定位置,并将通知您可以继续 Web 制作会话。如果数据提取创建失败,系统会通知您无法创建数据提取,并且您可以通过在 Web 制作中重新打开原始工作簿来还原未保存的更改。
定义您的数据提取设置
(可选)配置以下一项或多项选项来指示 Tableau 如何存储、定义筛选器并限制数据提取中的数据量:
决定应以何种方式存储数据提取数据
您可以选择让 Tableau 使用两种结构(架构)之一将数据存储在数据提取中:逻辑表(非标准化架构)或物理表(标准化架构)。有关逻辑表和物理表的详细信息,请参见“Tableau 数据模型”。
所选的选项取决于您的需求。
注意:“逻辑表”和“物理表”选项都只会影响数据提取中数据的存储方式。这些选项不影响数据提取中的表在“数据源”页面上的显示方式。
物理表之间的所有联接均为等值 (=) 联接
用于关系或联接的列的数据类型相同
未使用直通函数 (RAWSQL)
未配置增量刷新
未配置数据提取筛选器
未配置“前 N 个”或抽样
逻辑表
使用数据源中每个逻辑表的一个数据提取表存储数据。定义逻辑表的物理表与该逻辑表合并并存储在一起。举例来说,如果数据源由单个逻辑表组成,则数据将存储在单个表中。如果数据源由三个逻辑表组成(每个表包含多个物理表),则数据提取数据将存储在三个表中,每个逻辑表一个。
如果要使用其他数据提取属性(如数据提取筛选器、聚合、“前 N 个”或需要非规范化数据的其他功能)限制数据提取中的数据量,请选择“逻辑表”。当数据使用直通函数 (RAWSQL) 时,也使用“逻辑表”。这是 Tableau 用于存储数据提取数据的默认结构。如果在数据提取包含联接时使用此选项,则会在创建数据提取时应用联接。
物理表
使用数据源中每个物理表的一个数据提取表存储数据。
如果您的数据提取由使用一个或多个等值联接合并的表组成,并且满足下面列出的“使用‘物理表’选项的条件”,请选择“物理表”。如果使用此选项,则会在查询时执行联接。
此选项能够潜在地提升性能和减小数据提取文件的大小。有关 Tableau 如何建议您使用“物理表”选项的详细信息,请参见 Tableau Desktop 帮助中的关于使用“物理表”选项的提示。在某些情况下,您也可以使用此选项作为行级安全性的解决方法。有关使用 Tableau 的行级别安全性的详细信息,请参见-Tableau Desktop 帮助中的在数据行级别限制访问权限。
使用“物理表”选项的条件
若要使用“物理表”选项存储数据提取,数据提取中的数据必须满足下面列出的所有条件。
如果以“物理表”方式存储数据提取,则无法向其附加数据。对于逻辑表,不能将数据追加到具有多个逻辑表的数据提取。
确定要提取多少数据
单击“添加”定义一个或多个筛选器,以限制基于字段及字段值提取的数据量。
对数据提取中的数据进行聚合
选择“聚合可视维度的数据”以使用度量的默认聚合来聚合度量。对数据进行聚合可以合并行,并且可以最大限度地减少数据提取文件的大小并提高性能。
选择对数据进行聚合时,也可以选择按指定的日期级别(例如“年”、“月”等)来“汇总日期”。下面的示例说明了如何为您可以选择的每个聚合选项提取数据。
原始数据 每个记录都显示为一个单独行。数据中共有 7 行。 聚合可视维度的数据 (无汇总)
具有相同日期和地区的记录已聚合到一行中。数据提取中共有 5 行。 聚合可视维度的数据
(按“月”汇总日期)日期已按“月”级别进行汇总,并且具有相同地区的记录已聚合到一行中。数据提取中共有 3 行。 选择要提取的行
选择要提取的行数。
可以提取所有行或前N 行。Tableau 首先会应用筛选器和聚合,然后从经过筛选和聚合的结果中提取行数。行数选项取决于要从中进行提取的数据源的类型。
注意:
并非所有数据源都支持抽样。因此,您在“提取数据”对话框中可能看不到“抽样”选项。
数据提取中将不包括您最初在“数据源”页面或工作表标签页中隐藏的任何字段。
限制
不能为引用已发布数据源的嵌入式数据源创建数据提取。作为解决方法,请直接在已发布的数据源上创建数据提取。有关详细信息,请参见在内容服务器上提取已发布数据源。
无法为基于文件的数据源创建数据提取。基于文件的数据源已经具有特殊的性能功能,添加数据提取将没有性能优势。
此功能不适用于 Tableau Online 中基于桥接的数据源。
在内容服务器中创建数据提取
在内容服务器上提取已发布数据源
若要提取发布的数据源,请执行以下操作:
以管理员或数据源所有者的身份登录。
在“内容”选项卡上,选择“浏览”>“数据源”。
通过单击数据源名称选择数据源。
在屏幕顶部的“数据源”名称下,选择显示“实时”的下拉菜单。
将连接类型从“实时”更改为“数据提取”。如果在站点上启用了静态数据提取加密功能,请选择“已加密”或“未加密”。
如果看到有关嵌入凭据的错误消息,请将凭据嵌入到数据源中。为此,请单击“编辑连接”。 选择“连接中的嵌入式密码”,然后单击“保存”。
在内容服务器上提取嵌入式数据源
提取嵌入在已发布工作簿中的一个或多个数据源:
以管理员或数据源所有者的身份登录。
导航到已发布的工作簿。
导航到“数据源”选项卡
选择一个或多个数据源。
单击“操作”按钮。
单击“数据提取”。如果在站点上启用了静态数据提取加密功能,请选择“已加密”或“未加密”。
限制
您的连接凭据必须嵌入到数据源中。
在 Web 中,无法指定像增量刷新和数据提取筛选器这样的数据提取设置。
不能为引用已发布数据源的嵌入式数据源创建数据提取。作为解决方法,请直接在已发布的数据源上创建数据提取。
无法为基于文件的数据源创建数据提取。基于文件的数据源已经具有特殊的性能功能,添加数据提取将没有性能优势。
此功能不适用于 Tableau Online 中基于桥接的数据源。
使提取的数据保持最新
提取数据后,可以选择设置数据提取刷新计划,以使数据保持最新。有关详细信息,请参见按计划刷新数据。
监视和管理数据提取
服务器管理员可以在“数据提取后台任务”管理视图中监视数据提取创建。有关详细信息,请参见数据提取后台任务。
服务器管理员可以在“作业”页面上管理数据提取。有关详细信息,请参见在 Tableau Server 中管理后台作业。
数据提取创建作业(如数据提取刷新作业)在超时之前有最大查询限制。这是为了防止作业永远运行和使用无限数量的服务器资源。数据提取查询限制超时可由服务器管理员使用 TSM 命令行界面配置设置 backgrounder.querylimit
进行配置。有关详细信息,请参见tsm configuration set 选项。
服务器管理员可以管理 Web 制作。有关详细信息,请参见设置站点的 Web 制作访问权限和功能。