优阅达 | Tableau 微课堂(34):聚类分析

published: 2021-07-20

聚类分析

群集分析是一种统计分析方法,用于根据某些特征识别相比其他项彼此联系更加紧密的项,Tableau 聚类分析功能使用K均值聚类分析法,仅需简单拖放,即可执行群集分析。

K均值聚类分析法

先随机选取K个对象作为初始的聚类中心。然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。一旦全部对象都被分配了,每个聚类的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断重复直到满足某个终止条件。

终止条件可以是以下任何一个:

  • 没有(或最小数目)对象被重新分配给不同的聚类。

  • 没有(或最小数目)聚类中心再发生变化。

  • 误差平方和局部最小。

认识聚类分析工具

如果视图支持聚类分析,则仅需单击分析窗格,将“群集”拖动到相应框。

群集会在视图中自动填充颜色。

可控制“群集数”,以及用于计算群集的变量。

修改聚类分析算法字段

Tableau 自动使用可从视图中获取的字段来创建初始群集。群集计算后,即与视图中的度量值无关。

如要更改聚类分析算法使用的字段,仅需将字段拖进变量框中,或拖出变量框。

群集的相关选项

完成群集的初始创建后,可右键单击“群集”,并选择图标中的“编辑群集”,将变量框打开。

如需查看群集的相关信息,请右键单击“群集”后,选择“描述群集”,这将打开结果摘要。

群集创建为颜色功能区上的新图标,但该图标可拖动到数据窗格以另存为组。

哪些视图支持聚类分析?

01 数据不可归属于多维数据集

02 视图必须至少具有一个维度

03 或如此处所示:关闭聚合

04 某些字段不可用于聚类分析的输入,包括日期、数据桶、集和表计算。

本节 Tableau 微课堂到此结束,感谢你的耐心阅读。

下节课将带你学习 仪表板及故事入门 。