社区
博客
想在数据时代不被淘汰?数据素养是关键
数据分析小白成长指南:从这四个概念开始

我们都曾有过这样的经历:在与朋友聊天、看新闻或参加会议时,话题突然转向数据。这时,你可能会感到有些不知所措,因为你不确定该如何解读这些数据。其实,这种感觉很正常。在 Tableau,我们坚信,每个人都需要具备一定的数据素养。那么,数据素养究竟是什么呢?

数据素养是指一个人发现、理解和运用数据的能力。它就像一门语言,每个人都可以学会。无论是营销人员、数据科学家,还是平面设计师,都需要掌握一定程度的数据素养。当然,不同角色所需的数据技能会有所不同。

接下来,我们将从以下四个维度展开,开启你的数据素养之旅。


01、保持好奇心,勇于向数据提问

在信息泛滥的时代,我们被海量数据包围,这些数据本意是为了辅助我们更好地理解世界。然而,若不深入探究,我们可能只看到了表面现象,而错过了背后更深层次的真相。好奇心驱使我们提出问题,而这些问题则是我们深入理解世界的钥匙。

每当我遇到新奇的事物,或是听说一条令人向往的远足路线,亦或是社交媒体上推荐的可能改善生活的新产品时,我都会激发出强烈的好奇心。正是这种好奇心和提问的习惯,让我能够发现新奇事物,避免陷入困境,甚至避免采用不适合自己的方法或产品。

“当我们试图理解数据和信息时,不妨从几个开放式问题入手:什么、何时、何地、为什么以及如何。这些问题就像探照灯,能帮助我们照亮未知的角落。就拿徒步旅行来说吧,如果想判断一条路线是否适合自己,我们可以问:这条路有多长?路况如何?难度系数是多少?通过不断提问,我们能更全面地了解这条路线,做出更明智的选择。

丰田佐吉的‘五个为什么’也是一个很好的工具。当我们遇到问题时,可以不断追问‘为什么’,直到找到问题的根源。这种刨根问底的精神能帮助我们解决问题,不断提升自己。

在探索数据的过程中,我们可能会发现一些与预期不符的结果。这很正常,也是学习和成长的机会。重要的是保持开放的心态,接受新的发现,并根据这些发现调整我们的想法和行动。


02、讲数据术语

每个圈子都有自己的“行话”,数据世界也不例外。就像不同运动项目有各自的术语一样,数据分析也有其特有的语言。如果我们不懂这些术语,就很难深入理解数据,更别提做出正确的决策了。

想象一下,如果你想让一个不懂赛车的人帮你倒车,可能会发生什么?因为你们对“打方向”和“踩离合”等术语的理解不同,很容易发生误解,甚至造成危险。数据也是如此,如果我们对数据术语的含义不清,就可能得出错误的结论。

在这篇文章中,我们将重点介绍两个基础但重要的数据术语,帮助你更好地理解数据。

第一个是“总体”(Population)。很多人可能会误以为它只指人口,但实际上,它可以指任何我们感兴趣的研究对象,比如一个城市的所有居民、某款手机的所有用户、或者所有已知的星系。为什么“总体”这么重要呢?因为我们分析的数据通常是从总体中抽取出来的样本。如果我们没有明确定义总体,就可能得出错误的结论。

假设你要购买一条新表带。你查看评论发现一条表带评分为 5 星,而另一条只有 4.8 星。你的第一反应是选择 5 星表带,但你注意到 5 星表带只有 3 条评论,而 4.8 星表带却有 2,500 条评论。2,500 条评论比 3 条评论更难保持高评分,因此我们对 4.8 星评分的信心要高于 5 星评分。在这种情况下,了解我们的人口规模会改变我们对数据的理解,并因此改变我们的决策。

第二个词是变量,它表示可以变化的事物的特征。理解变量是数据分析的第一步。只有掌握了变量的含义,我们才能深入挖掘数据,发现其中的规律。

想象一下,你正在决定度假地点。有很多因素可能会影响你的决定,但为了方便,你选择了一些最重要的因素。你想要一个炎热的地方,有很多食物可供选择,而且交通不拥堵。带着这些标准,在搜索过程中,你比较了不同城市的气温、餐馆数量和交通状况。这些因素因城市而异,为你提供了作出决策所需的具体信息。


03、选择最适合的数据采集方法

当我听到“数据”这个词时,我会想象电子表格、复杂代码和具有挑战性的数学运算。但事实是,数据只不过是为了更好地理解某事而收集的信息。无论你是否在不久的将来收集数据,了解数据的产生方式以及收集数据的一些方式都是很有帮助的,这在很大程度上取决于具体情况以及你想要了解的内容。

不久前,我把车送到经销商处保养,保养后不到一天,我就收到一条短信,要求我填写一份调查问卷,向他们反馈我的体验。这说明经销商正在寻找有助于改善体验的数据,他们之所以使用短信调查问卷,是因为他们想让我轻松完成,从而增加填写调查问卷的几率。

汽车经销商在维修车辆后提供的整体体验调查提示

收集数据的方法多种多样,包括问卷调查、访谈、观察(例如故障排除)、网页抓取(即在线或应用程序中的活动跟踪)、机器测量等等。每种方法都最适合当时的情况,可以提供最有用的反馈。

就像我们和朋友聊天时,有时会直接询问意见,有时会观察他们的行为一样,数据收集也是如此。每种方法都有其独特的优势,能为我们提供最直接、最有价值的信息。


04、了解数据存储位置

数据,作为信息的一种形式,需要妥善存储和管理。回想一下你上一次参加工作视频会议时,当有人宣布了项目的下一步计划,你是如何确保自己不会遗漏任何细节的?我猜,大多数人会将这些要点记录下来,可能是在待办事项列表或笔记应用中,以确保记忆的准确性。

同样,收集到的数据也需要一个存储的地方。在数据量日益增长的今天,选择合适的存储方式至关重要,因为这将直接影响到你如何检索和利用这些信息来解答问题。

你可能已经熟悉一些常见的数据存储方式,例如:

  • 电子表格:如 Google Sheets 或 Excel,它们是记录和分析数据的基本工具。

  • 移动设备上的应用程序:如备忘录、健康追踪应用等,它们方便我们在移动中记录和访问信息。

  • 数据库:这是一种更为系统化的数据存储方式,可以包含多个电子表格或称为“表”的集合。数据库可以是本地的,也就是存储在你的设备上,也可以是云端的,即存储在远程服务器上,便于随时随地访问。

访问数据的方式多种多样,每种方式都有其特点。这里提供的不是全面解释,但可以简要说明:电子表格中的数据通常是开放的,我们可以直接操作这些数据,这意味着我们的任何修改都会直接影响原始数据集。

相比之下,数据库的使用方式则有所不同。我们通常会通过“查询”来处理数据库中的数据,这听起来像是在向数据提问,并在分析工具中查看结果。这种方法的好处在于,它避免了对原始数据的直接修改,让我们能够自由地提出各种问题,同时不必担心破坏我们收集的数据。这种查询机制为我们提供了一种安全的数据探索方式。


结 语

具备数据素养意味着能够理解、分析和有效利用数据,这是当今信息驱动社会的关键能力。它不仅帮助我们做出基于证据的决策,而且提高了我们解决问题的能力,促进了批判性思维,并使我们能够从大量信息中提取有价值的见解。简而言之,数据素养是解锁数据潜力、推动知识进步和创新的基础。


获取最新的数据新闻

注册以获取 优阅达 Data Blog 的快讯、见解和研究