全部 基础入门

Alteryx 微课堂 | 第10课:排序数据

发布于: 2023-12-05

▶ 本节课我们一起来学习:排序数据,学习如何使用排序工具以升序或降序排列数据值。

为便于大家更好地跟随操作,接下来,我把视频的内容用图文形式进行拆解。


排序数据

按特定顺序对值进行排序可以为你的分析提供更有意义的见解,特别是在了解值与数据中的其他值的比较时。通常,对三种不同类型的值进行排序:字符串、数字和日期。这些值可以用两种方式排序:升序或降序。

对于分类为字符串数据类型的列,值按字母顺序排序。当按升序排序时,以字母表开头的字母开头的值将出现在数据集的顶部,以字母表末尾的字母开头的单词将出现在数据集的底部。按降序对值进行排序会反转这些结果。

对于数值数据,按升序排序将把最小的值放在列的顶部,最大的值放在列的底部;降序将是相反的,从最大到最小。

当日期按升序排序时,最前的日期将出现在列的顶部,最新的日期出现在列的底部。

1、配置排序工具

在分析过程中,对 2016 年、2017 年和 2018 年在纽约市种植的树木的数据进行了准备和混合。现在,你希望对数据进行排序,以便更好地可视化和理解该数据集包含的值,包括市镇名称、种植日期以及树的常用名称。

从“收藏夹”工具调色板中拖动排序工具并将其拖放到画布上。

排序工具的配置需要两条信息:要对其值进行排序的列,以及排序的顺序。使用排序工具配置窗口中的下拉菜单按升序对“市镇名称”列进行排序。

在运行工作流之后,列“市镇名称”中的值从 Bronx 到 Staten Island 排序。即使是最基本的分类,也能提供一个更有序的视图,显示每个行政区种植的树木。

2、多列排序

通过一次对多个列进行排序,创建排序级别,向下钻取数据中更具体的趋势。通过按降序对列“栽植日期”中的值排序,添加额外的排序级别。

现在,对于每个行政区,最近种植的树木位于数据集的顶部,而最老的树木位于数据集的底部。当在用于排序的列中发现重复值时,输出将保留数据在输入数据集中出现的顺序。

3、排序的字符串

排序工具提供了对各种全局字母按字典顺序分类为字符串数据类型的列进行排序的能力。选择此选项将使用考虑源数据中的语言字符的规则对文本列进行排序,并且还会产生与字符串值的默认排序行为不同的结果。

默认的行为

通过按升序对列“常用名称”排序,探索字符串值的默认排序行为。

默认情况下,字符串值将根据值所包含字符的 ASCII 值进行排序。这意味着包含标点符号的字符串,比如单引号,将出现在数据集的顶部,后面跟着以大写字母开头的值,然后是小写字母。

启用字典顺序

现在,将排序工具配置为美国英语的“使用字典顺序”。在启用了字典顺序的情况下运行工作流后,输出已更改。现在,值显示了它们在字典中的顺序,无论它们的情况如何。


更多帮助

有关使用排序工具的更多帮助,请访问

https://help.alteryx.com/current/en/designer/tools/preparation/sort-tool.html


以上就是关于「排序数据」的全部内容。感谢观看本视频,更多 Alteryx 学习资源,请持续关注 Alteryx 社区。