优阅达“优课堂” | 第4课:Tableau 数据入门
published: 2021-11-10 18:00

欢迎观看由优阅达制作的【优课堂】系列视频。第四节课是 Tableau 数据入门,你可以下载本视频所用数据集同步实操。


连接到 Excel 文件

Tableau 可以连接到很多数据源。点击左侧“数据连接”窗格,有一个常用的数据连接器列表。包含了各种数据源,如:平面文件、关系数据库、多维数据集、大数据数据源、以及在线数据源等。

请注意:在使用 Mac 时,由于数据库方面的限制,部分连接器不可用。

今天,我们用 Tableau 自带的“示例-超市”数据源来演示:如何连接数据源。“示例-超市”是一家超市零售企业的销售额数据集,这家企业销售家具、办公用品以及技术商品。

点击 Microsoft Excel,导航到要连接的数据源,然后点击打开。


数据源页面

现在显示的是 Tableau 的数据源页面。在左上角,可以看到一个已成功连接的数据名:示例-超市。如果我们想修改名称,则鼠标单击名称,即可进行重命名操作。

在左侧窗格中,可以看到“示例-超市”数据源中的数据表包含:订单表、退货表和销售人员表。我们可以选择连接到单个表,也可以选择连接到多个表。

比如,我们选择连接到订单表,可以直接把订单表拖到画布中间。如果想重命名此数据表,则单击表名右侧的下拉箭头,在菜单中选择重命名即可。

画布下方是“数据概览”窗格,我们可以在此处做很多事情。比如:修改 “行 ID” 字段的名称,将其显示为 “ID”,只需点击下拉小三角,打开菜单,选择重命名,即可修改为 ID。

也可以更改字段的数据类型。一般带有 # 号的字段,表示为 “数值” 型;带有 ABC 的字段,表示为 “字符串” 类型;带有日历图标的字段,则表示为 “日期” 型数据。

现在,我们希望将 “ID” 字段转换成 “字符串” 类型,只需点击图标,选择 “字符串”。这样,就把 ID 字段从数值型转换成字符串类型。

如果某个字段包含合并的数据,如 “订单 ID” 字段。我们想要将其拆分,则可以点击下拉小三角,在菜单中选择 “拆分” 或 “自定义拆分”。


实时与提取

在开始数据分析之前,还需要考虑数据连接方式是 “实时连接” 还是 “提取”。

如果是实时连接,数据会保留在数据库或者源文件中:

  • 如果希望利用高性能数据库的处理能力,或者在一秒内让数据实时变化,那实时连接就是最好的选择。

  • 尽管如此,根据数据库的不同,有时候实时连接会导致数据处理速度变慢。

另一个选择是数据提取,把数据提取到 Tableau 的高性能数据引擎中:

  • 当连接到较慢数据库、或是转移关键系统查询负载的情况下,我们可以选用数据提取。

  • 在数据提取过程中,如果只希望用部分数据进行分析,可以点击“编辑”来提取部分数据。

比如,我们只想分析 2018 年的订单数据,就点击 “添加” 按钮,在弹出的筛选器对话框中找到 “订单日期” - “年”,只选择 2018,点击确定,随即转到工作表 1,即可完成数据提取。

需要注意的是:根据数据源的性质不同,部分数据源可能对实时连接和数据提取有限制。如 OLAP(联机分析处理)是不能提取的。但基于云数据,则必须用数据提取。

在本次演示中,我们采用实时连接。单击底部的 “工作表 1”,进入工作区界面。

如果想要返回到数据源界面,则单击底部的“数据源”选项卡即可。

现在,我们已经成功连接到 “示例-超市” 数据源的订单表。在工作区左侧的 “数据” 窗格中,可以看到字段名称。接下来,我们可以进行一个简单的数据分析。

例如,要查看根据订单日期来统计的销售额情况。我们将维度 “订单日期” 字段拖到列,将度量 “销售额” 字段拖到行。

将列上的“年(订单日期)”胶囊进行下钻,比如下钻到季度。我们甚至可以将“年(订单日期)”胶囊拖放到“标记”卡的颜色中。这样,一个简单的数据分析就做好了。


通过联接引入更多数据

如果需要引入更多的数据,就需要编辑数据连接。

单击底部的“数据源”选项卡,进入数据源界面;再单击订单表的下拉小三角,选择打开。然后,将退货表也拖到画布中。此时,Tableau 会自动将两张表中有关联条件的字段进行关联。

点击连接方式,可以看到:Tableau 自动将订单表的 “订单 ID” 字段与退货表的 “订单 ID” 字段进行内部联接。

我们也可以更改为左联接、右联接,甚至是完全外部联接。还可以选择或添加想要的关联字段(联接子句)。

随着所选联接方式的不同,在数据“概览”窗格中,预览的数据也是不一样的。

如果选择左联接,Tableau 将以订单表为主表,退货表为辅表,进行联接。这里,我们选择内部联接。

联接成功后,点击底部的 “工作表 1”选项卡,返回工作区界。在左侧“数据”窗格中,可以看到一些变化:订单表和退货表的名称分别加粗呈现了。

有时候,数据中的字段可能很多,在分析过程中不利于查找。这时,就可以使用搜索功能。比如我们想搜索ID相关的字段,可以在搜索框中输入 ID,Tableau 会将所有数据表中涉及ID的字段全都显示出来。



以上就是关于「Tableau 数据入门」的全部内容。感谢观看本视频,更多 Tableau 学习资源,请关注微信公众号“优阅达大数据生态”。