发布的数据源的最佳做法
- 版本 :2022.1 及更高版本
适用于: Tableau Desktop
将数据源发布到 Tableau Online 或 Tableau Server 是维护单一数据源必不可少的一个步骤。通过发布也可以在同事之间共享数据;包括在那些不使用 Tableau Desktop 但有权在 Web 编辑环境中编辑工作簿的同事之间共享。
对发布的数据源所做的更新将流向所有连接的工作簿,不论是否已发布工作簿本身。
已发布数据源的组成部分
Tableau 数据源由以下部分组成:
描述想要送到 Tableau 中进行分析的数据的数据连接信息。当您在 Tableau Desktop 中连接到数据时,您可以创建联接,包括不同数据类型的表之间的联接。对于将使用您发布的数据源的人员,您可以在“数据源”页面上将字段重命名为更具有描述性的字段。
数据提取(如果您决定创建数据提取)。下面以及附加资源中包括了有关何时创建数据提取的准则。
有关如何访问或刷新数据的信息。连接还包括访问信息。此类型的信息的示例包括:
原始 Excel 文件的路径。
用于直接访问数据的嵌入式凭据或 OAuth 访问令牌。
或者,不提供凭据,以便在用户想要访问数据时提示用户输入凭据(无论凭据是用于查看数据所连接到的工作簿,还是用于将新工作簿连接到数据)。
有关详细信息,请参见设置凭据以访问您发布的数据。
有助于您和他人有效地使用数据源的自定义和清理。处理您的视图时,您可以添加计算、集、组、数据桶和参数;定义任何自定义字段格式;隐藏未使用的字段等等。
所有这些改进都会成为您将发布和维护的数据源中所包含的元数据的一部分。
准备要发布的数据源
发布数据源时,请考虑以下最佳做法:
为想要带入到 Tableau 的信息创建连接,并执行任何自定义和清理工作,这将帮助您和其他人有效地使用数据源。
如果合适,请创建您想要发布的数据的数据提取。有关详细信息,请参见以下部分:何时使用数据提取。
制定数据源命名约定。
发布数据源后,您可以在 Tableau Online 或 Tableau Server 中对其重命名。若要重命名已发布数据源,请选择数据源名称旁边的“更多操作”菜单。然后,选择“重命名”并输入新名称。您还可以使用更新数据源 REST API来重命名已发布数据源。确保使用考虑周全的命名约定帮助其他数据用户推断出要连接到的数据源。
重命名已发布数据源后,使用该数据源的所有工作簿将在下一次数据源刷新完成后使用新名称。与重命名工作簿一样,重命名已发布数据源不会保存在数据源的修订历史记录中。
您可以为数据源添加和编辑标题,但更改标题不会更改基础已发布数据源的名称。如果您编辑基础已发布数据源名称,则不会更新标题。但别担心 — 仍然引用了正确的数据源。您将在“数据源”选项卡中看到更新的基础已发布数据源名称。
考虑在 Tableau 用户之间指定以下角色:
集中管理有助于避免数据源扩散。连接到托管数据的作者可以确信他们在其中找到的答案反映了业务的当前状态。
为 Tableau 社区创建和发布数据源的数据专员(或团队),这些数据源可满足组织的数据需求。
在发布的服务器(Tableau Server 或 Tableau Online)上管理已发布内容、数据提取刷新和权限的站点管理员。
何时使用数据提取
在以下情况下,可能需要或可以选择发布数据提取而不是实时连接。
将无法直接连接的数据发布到 Tableau Online
云中的 Tableau Online 不能到达您在本地网络上维护的数据源。根据连接,您可能需要使用 Tableau Bridge 发布数据提取并设置刷新计划。
有些云托管数据源总是需要数据提取。这些数据源包括 Google Analytics、Salesforce.com、Oracle、OData 和一些 ODBC 数据源。您可以直接在 Tableau Online 上为其中一些数据源设置刷新计划;对于其他数据源,您可以使用 Tableau Bridge。
Web 数据连接器数据源始终需要数据提取。如果使用标准用户名和密码身份验证连接到数据源,您可以使用 Tableau Bridge 对其进行刷新。如果使用 OAuth 身份验证连接到 WDC 数据源,您将需要使用替代方法刷新它。
有关 Tableau Bridge 如何支持 Tableau Online 无法直接访问的数据提取和数据实时连接,请参见 Tableau Online 帮助中的使用 Tableau Bridge 扩展数据新鲜度选项。
提高性能
即使服务器支持您的实时数据连接,数据提取仍然可能更有意义。举例来说,如果数据库很大或连接速度很慢,则可以只提取包括相关信息的子集。与实时连接相比,数据提取处理起来更加轻松和快速。
在可以使用按计划刷新的实时连接或数据提取的情况下,您可能想要实验这两个选项,看看哪一个最适合您。
启用数据源本身不支持的功能
例如,假设您想要将中值函数与 SQL Server 数据配合使用。
有关创建数据提取的详细信息,请参见提取数据。
单独或嵌入在工作簿中发布数据
您可以将数据源作为工作簿连接到的独立资源发布,或者可以随工作簿中包括的数据源一起发布工作簿。
当您发布工作簿时,如果任何连接指定了发布到同一项目的 Tableau 数据源以外的其他内容,则数据将作为工作簿的一部分进行发布(有时称为嵌入到工作簿中)。
在工作簿中嵌入数据时:
对数据源的访问限制为只能从在其中发布工作簿的工作簿中进行。您和其他用户都无法从另一个工作簿连接到该数据。
您可以设置数据提取刷新计划,就像为单独发布的数据源设置计划一样。
每种发布方式都有其优势。下表显示了几个常见的比较点。它不是一个全面的列表,这些比较点是一般化比较点。这些因素及其他因素如何适用于您将特定于您的环境。
单独发布、 | 嵌入工作簿中 |
---|---|
发布数据源是实现数据集中管理的一步。您可以创建专为最大程度减少数据源扩散并帮助用户找到适合其工作的正确数据而设计的策略。 | 每个嵌入的数据源具有单独的数据连接。 在任何给定的时间,每个人显示的内容都可能与其他人显示的内容不同(数据源扩散是常见现象)。 |
应该共享;可供要连接到的其他 Tableau 用户使用。 | 数据只能用于工作簿内部;无法供要连接到的其他 Tableau Desktop 用户使用。 |
如果没有内容管理和自助服务准则,看到一长列要连接的数据源可能会对依赖于数据完成工作的用户造成困惑,而且很难在服务器上进行管理。 | 用户创建自己的连接,并且准确地知道他们所获取的内容。 |
更改共享数据源的用户可能会不确定或不了解他们所做更改对连接的工作簿产生的影响。 | 更改数据需要打开工作簿,在其中您可以看到更改的结果。 |
即使数据源更改对已连接工作簿的影响已在规划之中,但更新这些已连接工作簿也非常繁琐。 | 同上所述;但是,如果多个工作簿使用类似的数据并且需要更新,则改为连接到发布的数据源可能是值得的。 |
数据提取可以按计划刷新。您为数据提取设置一个刷新计划,连接到该数据提取的所有工作簿始终会显示最新数据。 | 未刷新的嵌入式数据提取可用于及时显示快照。 如果想要使数据保持最新,则每个工作簿都必须有自己的刷新计划。 |
通常可帮助您在服务器或站点上优化性能。 | 当服务器包含连接到相同原始数据的多个工作簿,并且每个工作簿有其自己的刷新计划时,性能可能会受到影响。 |
使数据提取保持最新
如果发布的数据源包含数据提取,您可以按计划刷新数据源。计划刷新的方式取决于数据源的类型以及是要发布到 Tableau Server 还是发布到 Tableau Online。
有关详细信息,请参见以下主题:
其他资源
Data Server — Tableau 的培训视频,其中包含数据源和发布的有用概述。
Tableau 博客上 Gordon Rose 创作的版本不明的三部分系列。它包括深入了解数据提取的文件结构、数据提取使用时间准则和最佳做法。
O 数据提取,您在哪里?以及 TDE 还是实时?何时使用 Tableau 数据提取(或不使用)
Tableau 讲师 Jonathan Drummey 在其博客“Drawing with Numbers”上发表。包括关于数据提取的提示,说明不同的文件类型,描述不同的发布方案。(另请阅读注释。)
来自 Tableau 金牌合作伙伴 Information Lab 维护的博客。
免责声明:尽管我们尽最大努力确保外部网站的链接保持正确、最新并相关,但 Tableau 对于外部提供商所维护的页面的准确性或新鲜度不担负任何责任。请与外部网站联系来获取其内容相关问题的答案。