内容:

使用生成的标记的预测建模

  • 版本 :2022.1 及更高版本

适用于: Tableau Desktop, Tableau Online, Tableau Public, Tableau Server

如果您使用 Tableau 有一段时间了,您可能听说过“数据致密化”这一短语。这指的是由 Tableau 生成标记并添加到视图中的过程,即使基础数据源中的记录不支持这些标记。这可能是为了扩展日期轴,或者如果您正在使用预测建模函数函数,则是为了显示预测。

观看视频:有关数据致密化的深入讨论,请查看 TC19 中的此演示文稿:您对数据做了什么?深入探讨数据输入和致密化

了解更多信息:请参见 Data Plus Science 中有关数据致密化的此博客文章。

计算针对缺失值的预测

例如,您可能希望添加针对将来日期的预测。默认情况下,Tableau 中的缺失值不会显示,但您可以按如下方式生成这些标记:

  1. 右键单击(在 Mac 上按住 control 键单击)日期或数据桶标题。

  2. 选择“显示缺失值”

    选择了“显示缺失值”的胶囊上下文菜单

  3. 但这还不足以让您针对这些生成的标记进行预测。如果您尝试对它们执行计算(无论是否为预测计算),Tableau 将返回 null 值。这是预料之中的,因为这些标记基于不存在的缺失值。

    若要针对这些缺失值进行预测,请打开顶部的“分析”菜单,然后选择“通过缺失值推断属性”

    选择了“通过缺失值推断属性”的“分析”菜单

    注意:默认设置是“通过缺失值推断属性”处于关闭状态,即使“显示缺失值”开启也是如此。可以使用“显示缺失值”扩展的任何字段或轴都可以应用此设置。

针对生成的标记的预测示例

现在,让我们进一步探讨此行为。我们将比较三种不同的例证,显示“显示缺失值”“通过缺失值推断属性”设置如何影响您的可视化项,具体取决于您是开启或关闭了其中一项设置还是者全部两项设置。若要继续操作,请从 Tableau Public 下载以下工作簿:针对缺失值的预测

我们包括了使用 ATTR(DAY([Order Date])) 作为预测因子的预测。这不是数据的最佳预测因子(并且生成的预测不足),但对于本文,它是“通过缺失值推断属性”的一个很好的例证。

每个可视化项在“行”功能区上包含相同的四个度量,如下所示:

  • 第 1 行:SUM([Profit])

  • 第 2 行:RUNNING_SUM(SUM([Profit]))

  • 第 3 行:ATTR(DAY([Order Date]))

  • 第 4 行:MODEL_QUANTILE(0.5, SUM([Profit]),ATTR(DAY([Order Date])))

例证 1

例证 1

在上图中,“显示缺失值”“通过缺失值推断属性”均处于关闭状态,这是 Tableau 中的默认设置。

如果“通过缺失值推断属性”开启,并且“显示缺失值”关闭,您会看到相同的可视化项。这是因为“通过缺失值推断属性”取决于开启的“显示缺失值”

例证 2

例证 2

在上图中,“显示缺失值”开启,并且“通过缺失值推断属性”关闭。默认设置是“通过缺失值推断属性”处于关闭状态,即使“显示缺失值”开启也是如此。

请注意,在此情况下,我们不会针对缺失值(第 3 行)在 DAY([Order Date]) 上计算 ATTR 的值。我们确实会为致密日期生成预测,但它们对于所有缺失日期都相同,因为我们无法推断出实际 ATTR(DAY([Order Date])),如第 3 行中所示。实际上,这些标记的计算方式就像 DAY([Order Date]) 为 null 一样。

例证 3

例证 3

在此图中,“显示缺失值”“通过缺失值推断属性”均开启,说明“通过缺失值推断属性”设置起作用。

如您所见,由于我们能够推断 ATTR(DAY([Order Date]))(第 3 行),因此我们能够在第 4 行的预测中使用它,同时返回一个很好的平滑预测曲线。