优阅达“优课堂” | 第1课:Tableau 基础入门(篇幅很长,建议收藏)
published: 2021-10-27 19:13

欢迎观看由优阅达制作的【优课堂】系列视频。第一节课是 Tableau 基础入门,你可以下载本视频所用数据集同步实操。


开始界面

在“开始”界面,我们可以连接到新数据、已保存的数据源,或者打开最近使用的工作簿。


连接到数据

在左侧“连接”窗格,展示了Tableau可以连接到的各类数据源,包括本地文件、服务器和已保存的数据源。

在本次示例中,我们将连接“全国超市”数据(如下图)。超市数据是一个 Excel 文件,数据结构类似数据库表:第一行包含列标题。该数据集包含购买具体产品的客户交易记录。

连接数据非常简单。只需在Tableau Desktop “开始”界面的“连接”窗格中,选择连接到 Excel,并导航到你电脑上的 Excel文件,然后双击打开。


查看数据

成功连接 Excel 文件后,将打开“数据源”页面。在这里,可以选择使用哪些数据工作表或表格。这里,我们把“订单”表拖拽到画布中。如果要从数据源调出更多信息,可以将其他表同样拖拽至画布。

请注意:在 Tableau Desktop 2020.2 及以上版本中,将数据表拖至画布后,Tableau 将通过“关系”模型呈现数据连接,而非以往熟悉的传统联接方式。

Tips:对于“关系”模型的讲解,我们会在之后的优课堂视频中做详细介绍。

接下来,双击画布中的“订单”表,把其他数据表拖至画布中。如下图所示,“订单”表和“退货”表通过传统的联接方式进行数据联接。

如需使用另一个数据源的相关数据,可以单击“添加”按钮,来创建整合式数据源。这里,我们引入关于被退回订单的 csv 文本文件。可以看到,“退货”数据源已自动添加至画布,同时可以在左侧窗格的“连接”区域看到跨数据库联接。

这里,还可以对来自 Hadoop 和 Redshift 的数据进行联接。由此可见,跨数据库联接是一项极为强大的功能。


联接和数据准备

Tableau Desktop 自动创建默认联接,就像在下图中看到的一样。单击“联接”图标,即可查看联接方式的详细信息。我们可以直接编辑这些信息。

此处选择“左联接”,这样既可以获取“订单”表格的所有信息,又可以仅引入被退回交易的相关“退回”信息。

可以看到,“订单ID” 已经被用作联接子句,但我们可以根据需要改变联接子句。

下方的“数据概要”网格,能够验证我们有什么样的数据。可以看到,这份数据中有很多记录有来自“退回”数据表的 Null 信息。这很好,说明这些记录没有退回信息。

我们可以在“数据概要”网格视图中进行一些基本的元数据管理。只需单击图标,就可以将“行ID”字段的数据类型 从“数字”改为“字符串”。

此数据集中的“订单ID”字段包含多个部分:配送中心代码、年份以及其他代码。如果我们想拆分此字段并仅保留配送中心代码,这非常容易办到。

只需单击字段名称旁边的下拉菜单并选择“自定义拆分”。我们将在“-”字符处拆分,只保留第一列。将该字段重命名为“配送中心”。


实时连接与提取

接下来,我们可以决定是实时连接到数据,还是提取数据。如果数据不断变化,或希望利用高性能数据库,“实时连接”是很不错的选择。

我们也可以选择通过“数据提取”把数据导入 Tableau 的快速数据引擎。这样可以获得离线数据,并让我们能够将关键系统受到的性能影响降到最低,同时仍然可以定期进行计划刷新,保持数据时效性。

这里,选择“实时连接”,并单击底部的工作表标签。


维度与度量

连接到数据集后,让我们来看看探索数据有多简单。只需拖出字段,先把“类别”和“细分”字段拖至“行”功能区,“数量”和“地区”字段拖至“列”功能区,同时将“地区”字段拖至标记卡上的“颜色”, 便可非常轻松地根据销售的物品数量,为每个类别、客户细分和地区的销售情况创建可视化。

可以很快得出结论,西北是新兴市场。你还可以看到,从左侧“数据”窗格引入了这些字段。它分成不同的维度与度量,分别代表Excel工作表中的列标题。

维度与度量是什么?

  • 维度是类别字段,在本例中,就是“日期”、“客户”和“类别”等字段。这些字段是我们对数值型数据进行切片和切块时的依据。维度常常是离散的。离散的字段在图表中形成标签,在“数据”窗格和视图中以蓝色进行颜色编码。

  • 度量则是指标,这是我们希望分析的数字。度量常常是连续的,连续的字段在图表中形成轴,其胶囊以绿色进行颜色编码。


构建视图

现在,假设我们想看销售总数,将度量“销售额”字段放入视图。可以看到, Tableau 查询数据库,并返回一个结果,告诉我们“销售额”总和。这家公司的销售额为 1,600 万出头。

如果我们希望看到随时间推移的销售情况,可以将维度“订单日期”字段拖到视图顶部。Tableau会以年度汇集日期,我们可以点击“+”号将其展开。现在,我们可以在视图中同时看到季度和年度。

想要查看几年来所有第1季度的情况,我们可以轻松透视数据,让“季度”在“年份”前面。

现在,我们比较一下这几年各季度的销售额增长情况。 把“年份”拖放至标记卡上“颜色”,就会以竖列的形式显示所有年份。如果我们不继续下钻,而是想把季度改成月份,可以单击“季度”胶囊,在下拉菜单中更改。

如果查看销售平均值要比销售总和更有用,只需使用胶囊的下拉菜单,将“度量(总和)”改为“平均值”即可。这里,我们暂且撤消此操作。


快速表计算

如果我们想知道年同比增长之类的信息,又要如何操作呢?再一次单击胶囊的下拉菜单,然后转到“快速表计算”,可以看到一些常见的业务计算。这里,选择“年度同比增长”。

如果我们仍然想查看原始的“销售额”,只需从“数据”窗格中,再次将度量“销售额”字段拖入“行”功能区即可。

如果想让“年度同比增长值”显示在工具提示而不是图表中,可以将其拖至标记卡的“工具提示”中。

当鼠标在视图标记上悬停时,工具提示可以提供更多信息。例如,我们看到2020年5月的数值比前一年同期提高了接近 60%。

当再把维度“类别”字段拖到“行”功能区,可以看到哪些类别的表现不错,在什么时间段表现不错。

我们还可以添加注释。例如,看到每年的销售额会在7月份下降,但会在秋季反弹。要添加注释,只需右键单击视图的空白位置,在弹出菜单中选择“添加注释”-“点”选项即可。

如果我们想和其他人分享当前视图,同样的右键单击视图可视化,在弹出菜单中选择“拷贝”-”图像”选项,即可复制此图像,然后就可以与伙伴们分享了。

双击工作表标签,将此工作表重命名为“销售季节性”。


交叉表与导出数据

如果我们想导出时间表背后的原始数字,该怎么做?再次右键单击图表可视化,在弹出菜单中,选择“复制”-”数据”选项,即可复制数据,然后将数据粘贴到 Excel 中。这里面还包括了我们执行过的快速表计算结果。

还可以右键单击底部的工作表选项卡,在弹出菜单中选择“复制为交叉表”,此时Tableau Desktop会自动将数据以交叉表的形式复制在一个新的工作表中。

在新工作表中转换一下字段的行列设置,将“类别”字段移至“行”功能区。这样,数据内容表达得更清晰。

如果担心办公用品促销活动期间以及年末的利润不是很好,则可以把利润添加到交叉表,看看情况到底如何。我们将度量“利润”字段拖放到标记卡的“颜色”,可以更清晰地理解总体趋势。

但这些颜色有点淡,我们来编辑一下显示方式。单击标记卡中的“颜色”,然后选择“编辑颜色”。

下拉菜单中有多种颜色可供选择,我喜欢绿色-金色,并设置为6色渐变。将标记类型更改为“方形”,勾选启用标记标签。现在,得到了利润的突出显示表。

右键单击“类别”胶囊,在弹出菜单中选择“高亮显示”。此时,视图右侧会出现一个类别字段的”突出显示”工具,我们可以用它来控制视图中的高亮显示内容,比如选择“办公用品”选项。

可以看到,办公用品数据中,2020年秋季为深绿色,所以那几个月中,利润相当可观。

我们选中“突出显示 类别”控件,并将鼠标悬停在那些选项上,可以很快看到:虽然技术和办公用品在秋季实现了很好的利润,家具却没有出现表示利润在上升的深绿色。

这种情况是不是发生在市场的所有门店?我们来研究一下吧!双击当前工作表选项卡,将此工作表重命名为“交叉表”。


智能显示

我们知道家具的利润不佳,并认为这可能存在地区上的差别,但不一定知道查看这些数据的最佳方法。

Tableau Desktop 提供了名为“智能显示(智能推荐)”的简单工具。如果我们已经有了希望查看的数据,却不知道如何创建有效视图,该工具可以提供帮助。“智能显示(智能推荐)”包含了常见的图表类型列表,可以帮助你开始分析。

注意:我们可以在 Tableau中构建种类繁多的图表 ,而“智能显示(智能推荐)”只是一键式的选项,并未全面列出可以构建的所有图表。

先把“城市”字段的地理角色设置为“城市”,把“省/自治区”的地理角色设置为“州/省/市/自治区”。

然后,在按住“Ctrl”键(WIN电脑)的同时选择不同的维度和度量字段,看看“智能显示(智能推荐)”如何工作。

这里,我们想了解“销售额”以及不同城市的销售情况。请注意,该工具会根据我们选择的度量和维度,突出显示不同的图表类型。 符号地图好像是不错的选择。

我们可以在标记卡的“大小”中,放大这些地图上的标记点。 同时,可以在“颜色”中调整一下透明度,加上边界。隐藏大小图例,然后用“利润”字段给这些城市着色。

请注意,我们还可以执行地理搜索。如果要查看特定地点的利润情况,可以直接 转过去。 现在,取消固定地图,地图将恢复原尺寸大小。


自定义区域

作为一家全国化公司,销售额在七月份出现上述所示的下跌。这是因为总部推行的某种做法,还是因为某种季节影响?

按内陆/沿海分组,细分各时间的销售额,我们就可以知道答案。然而数据中没有该字段,不过,我们可以直接在地图中自行创建自定义区域。右键单击工作表选项卡,复制此工作表,以便让原始视图保持不变。我们可以简化视图,去掉“省/自治区” 以外的所有数据。然后使用“套索选”择工具,选择大致覆盖内陆的标记。请注意,此处选择的是大致形状。

单击工具提示中的“回形针”图标,为这些“省/自治区”创建一个群组。这样,我们就在“数据”窗格中创建了新字段。

回到“销售季节性”工作表,将此新字段添加到列。总体来看,这家企业在内陆的收入要少一些。

请注意,如果我们只保留该列,就没有明确的季节性证据了。返回原始地图,将这个工作表命名为“全国销售额和利润”,并删除刚复制出来的地图工作表。


筛选器

之前,我们发现家具的利润比较差。为了进一步调查这个情况,把“类别”字段拖放到“筛选器”卡,选择“家具”。

要让其成为交互式筛选器,需要右键单击“筛选器”卡中的“类别”胶囊,在弹出菜单中选择“显示筛选器”。

我们还可以修改筛选器,方法是单击选择其下拉菜单,从各种选项中进行选择。在这里,我们选择 “单值(列表)”。 现在,任何人都可以轻松选择自己感兴趣的类别,比如“家具”、“技术”或“办公用品”。


条形图

我们知道家具有问题,但是,具体是哪些家具类型销售情况不佳呢?让我们创建新工作表,使用 “智能显示(智能推荐)”来一探究竟。

按住 Ctrl 键(WIN电脑)并选择感兴趣的变量,比如类别、子类别和销售额。再次看到“智能显示”给出了多种建议,我们逐项单击图表,看看哪一个最好。


分层结构

本例数据中,在”类别”和“子类别”字段之间,存在着自然的分层关系。

在 Tableau Desktop 中,我们只需要在“数据”窗格通过拖放操作和叠放字段,就能创建分层结构。把维度“子类别”字段拖到“类别”上,将这个新创建的分层结构命名为“产品”。我们还可以将“产品名称”添加到此分层结构。

在 Tableau Desktop 中创建该分层结构只需要几秒钟,并提供完全下钻功能。


排序

如果我们要根据总销售额对这三个类别进行排序,可以单击工具栏上相应的排序按钮。可以看到,“家具”的合计销售额最高。

如果扩展至子类别,我们就会看到这些条形标记也已经排序好了。

单击轴上的“快速排序”按钮,再次进行排序。注意,类别的次序保持原样,我们只是在每个类别内部对条形标记进行排序。

还可以单击工具栏中的“T”按钮,开启或关闭标记标签,从而查看实际销售值。

但我们同时还想知道利润的表现如何?将度量“利润”字段放到标记卡的“颜色”上。可以看出,“桌子”的利润情况比较差,尽管销售额看起来不错。

这种情况是不是发生在所有地区?我们把“地区”字段放到视图顶部。可以看到,在家具方面,几个地区看起来都存在同样的利润问题。


分组

我们还可以把类似的项目分到一组,这一点是很有帮助的。在“办公用品”中可以看到,几个项目的销售额非常小。

这时,就可以选中这些子类别的标题,并使用“回形针”图标对其进行分组;右键单击并选择“编辑别名”,将该行重命名为“小型办公用品”。

移除“地区”字段,并交换轴;右键单击列标题并隐藏该标签;将此工作表命名为“按子类别的销售额”。


使用标记

目前,已经看到一些利润方面的问题。直觉是,这可能是因为折扣降低了利润,让我们来分析下利润和运费。

创建一个新工作表,然后将 “利润”字段拖放到行, “折扣”字段放到列。这时候,Tableau 为利润和折扣生成标记。

将“类别”字段放到标记卡的“颜色”上,刚才生成的标记会按类别拆分,变成三个标记。

将 “客户ID”字段添加到标记卡的”详细信息”上。视图上的标记会进一步被拆分,变成每个客户每个类别都有一个单独的标记。此时的视图表示,折扣和利润的对比关系。

我们还可以完全解聚数据,在视图上显示每一笔交易。方法是单击打开菜单栏的“分析”菜单,取消勾选”聚合度量”选项即可。

还可以把标记卡上的字段分配给不同角色。例如,可以单击“类别”前面的“颜色”图标,将其改为“标签”。 也可以将字段直接放到标签中,例如“子类别”。

我们还可以单击标记卡的“标签”,在弹出的小窗口中,再次单击“文本”栏右侧的“...”小按钮,打开“编辑标签”对话框。在这里,我们可以对标签内容,按需进行修改和排版。修改完成后,单击确定。

然后,取消勾选“显示标记标签”选项。这样,视图中就不再显示标签内容了。

回到视图可以看到:各类别中,有大量的客户利润很低。因此,肯定值得调查一下。我很想知道,那些低利润订单是否被退回。

将“退回”字段放到标记卡上的“大小”中,Null 表示没有退回信息。可以看到,低利润订单并没有全部被退回。


趋势线

然而,是不是如我们所想,折扣和利润之间存在某种关系?在标记卡上,移除标签和大小上的字段设置,然后把“类别”字段拖入颜色,以便不受干扰地进行分析。

打开分析窗格,先选择趋势线,然后将其放到视图中。在 “家具”类别中,随着折扣上升,利润的下降幅度增大。

但当鼠标在趋势线上悬停时,可以看到,其 R 平方值非常低,因此它没有特别的意义;将趋势线拖走,然而,视图存在一些相当极端的低利润标记。

我们可以很快找出造成利润问题的客户。选择这些标记,可以直接查看底层数据。

将“类别”字段标记从“颜色”更改为“形状”,并将视图标记的颜色设置为灰色。然后,把当前工作表改名为“客户细分”。


仪表板

我们已经用这个数据集创建了一些很有见解的视图。现在,希望将其分享给我们的团队,并编制仪表板。

多个视图可以组合成单个仪表板,单击工作表选项卡右侧的图标,可以创建一个新的仪表板。

将其命名为“销售额仪表板”,调整仪表板大小,使之适合笔记本电脑屏幕。

所有的工作表都在左侧显示,我们可以通过鼠标悬停进行预览。

首先把“全国销售额和利润”工作表拖进仪表板视图,然后把“按子类别的销售额”和“客户细分”两个工作表放在其下方。最后在左侧“仪表板”窗格上,勾选“显示仪表板标题”选项,为仪表板添加标题。

请注意,当在交互式筛选器中选择不同类别时,只有地图会相应地发生变化。 但如果是想用筛选器,与仪表板中所有工作表交互呢?

可以打开筛选器的下拉菜单,选择“应用于工作表”-“应用到使用此数据源的所有项”。现在,仪表板上的所有工作表,都将根据筛选器的操作而更新显示内容。

但如果想下钻至地图上的详细信息,该怎么办?例如,地图上的四川有一个低利润标记,我们想了解这个标记是怎么来的。

单击选中“地图”工作表,再单击侧边的▼下拉菜单,选择“用作筛选器”,可以将整个地图转化为可视化筛选器。

这样,当我们在地图上选中某个标记时,下方的条形图和散点图就会自动更新,只显示该标记的信息。


故事点

如果我们想逐步引导观众,探索这些利润率问题,该怎么做?Tableau 提供一项名为“故事”的功能,便于你把一系列的具体视图汇编起来,逐步引导观众查看分析。

单击菜单栏中的“故事”-“新建故事”选项,即可建立一个新的故事,并让故事自动调整大小。

在故事中,我们可以引入此前制作的任何工作表和仪表板。将“全国销售与利润”工作表拖放到第一个故事点中;然后,在故事点导航器上输入:总体而言,我们的利润势头强劲。

接着,将“销售额”仪表板拖入第二个故事点的导航器里,仪表板同样就被放到第二个故事点中,我们可以根据需要对其进行大小调整。关闭故事的标题。

此时,在故事点中的仪表板仍然具有完整的交互性,我们可以进行筛选,调出四川的那个标记。

可以看到,在这样操作的同时,“更新”图标会显示在导航器的上方。单击“更新”,可以保存可视化的当前状态,让每个人不差分毫地看到当前的信息。

在导航器中输入“但一些领域存在问题”,将其作为标题。这是故事的一个重要方面,即在保持交互性的同时,能够对可视化内容的具体见解拍摄快照。


共享与协作

在这个工作簿中,我们已经从原始数据进展到了深入见解,现在,我们想考虑如何将其分发给其他人。最有效的工作簿分享方式,是将其发布到 Tableau Server 或 Tableau Online 中。

已发布的工作簿具有完整的交互性,随时保持最新版本,而且安全,可以通过浏览器或移动应用进行访问。

要进行发布,需点击菜单栏中的“服务器”-“发布工作簿”。我们可以发布至具体项目、命名工作簿、输入描述、标记内容、精确选择要发布的项目,并控制权限。

如果我们只想发布数据源供其他人使用,可选择“发布数据源”。

完成发布后,即可与内容轻松进行交互。所有内容都仍然具有完整的交互性,可以通过浏览器直接实现。

我们还可以订阅内容,以便按照设置的计划通过电子邮件发送更新;还可以收藏内容以及进行搜索和筛选。

借助 iOS 和 Android 应用,你甚至可以通过手机或平板电脑,从任何地点安全地访问仪表板和数据。



以上就是关于「Tableau Desktop 基础入门」的全部内容。感谢观看本视频,更多 Tableau 学习资源,请关注微信公众号“优阅达大数据生态”。