Power BI 微课堂 | 第2课:从文件中获取数据

發布於: 2023-05-08

今天,我们开始学习“数据连接”主题课程从文件中获取数据,学习如何将存储在本地计算机上的 Excel 文件数据导入 Power BI。


》文件格式

企业通常会将数据导出并存储在文件中。其中,“平面文件”为可能采用的文件格式之一。

“平面文件”是一种文件类型,其中或许只包含一个数据表,且每行数据都具有相同的结构。该文件不包含层次结构。

你可能已经熟悉最常见的平面文件类型,例如:逗号分隔值 (.csv) 文件、带分隔符的文本 (.txt) 文件和固定列宽文件。另一种类型的文件是来自不同应用程序的输出文件,如 Microsoft Excel 工作簿 (.xlsx)。

Power BI Desktop 允许从多种类型的文件中获取数据。使用“获取数据”功能时,可以看到一个可用选项列表。下面,我们将通过一个操作示例来说明如何从存储在本地计算机上的 Excel 文件中导入数据。


》示例操作

Tailwind Traders 的人力资源(HR)团队已准备好一个平面文件,其中包含企业内的部分员工数据,如员工姓名、雇用日期、职位和上级经理。他们希望使用这些数据以及其他多个数据源中的数据生成 Power BI 报表。


一、确定平面文件位置

第一步是确定要用于导出和存储数据的文件位置。你的 Excel 文件可能来源于以下位置:

  • 本地:你可以将数据从本地文件导入 Power BI 中。文件不会移动到 Power BI 中,并且不会保留指向该文件的链接。而是会在 Power BI 中创建一个新的数据集,并将 Excel 文件中的数据加载到其中。因此,对原始 Excel 文件所做的更改不会体现在 Power BI 数据集中。对于未更改的数据,可以使用本地数据导入。

  • OneDrive for Business:你可以从 OneDrive for Business 将数据拉取到 Power BI 中。这种方法可以有效地使 Excel 文件与 Power BI 中的数据集、报表和仪表板保持同步。Power BI 会定期连接到 OneDrive 上的文件。如果发现任何更改,你的数据集、报表和仪表板会在 Power BI 中自动更新。

  • OneDrive 个人版:你可以使用个人 OneDrive 帐户上文件中的数据,并获得与 OneDrive for Business 相同的诸多优势。但是,你需要使用个人 OneDrive 帐户登录,并选择“使我保持登录状态”选项。请与系统管理员联系,以确定你的企业是否允许这种类型的连接。

  • SharePoint 团队网站:将 Power BI Desktop 文件保存到 SharePoint 团队网站的过程与保存到 OneDrive for business 类似。主要区别在于从 Power BI 连接到文件的方式。你可以指定 URL 或连接到根文件夹。

使用云选项(如 OneDrive 或 SharePoint 团队网站)是使文件与 Power BI 中的数据集、报表和仪表板保持同步的最有效方法。但如果数据不会经常更改,则可在本地计算机保存文件。


二、连接到文件中的数据

在 Power BI 中的“主页”选项卡上,选择“获取数据”。在显示的列表中,选择所需的选项,例如“Text/CSV”或“XML”。在此示例中,我们选择“Excel”。

请注意:“主页”选项卡中包含一些快速访问数据源选项,例如“获取数据”按钮旁的如“Excel”。

根据所做的选择,你需要查找并打开数据源。系统可能会提示你登录到 OneDrive 等服务,以对你的请求进行身份验证。

在本示例中,我们打开存储在桌面上的“员工数据”Excel 工作簿(PS:此处不提供用于练习的文件,大家可参考步骤连接业务数据源)。


三、选择要导入的文件数据

文件连接到 Power BI Desktop 后,将打开“导航器”窗口。此窗口将显示数据源(在此示例中为 Excel 文件)中可用的数据。

你可以随意选择一个表来预览其内容,以确保将正确的数据加载到 Power BI 模型中。勾选要引入 Power BI 的表所对应的复选框。此选择将激活“加载”和“转换数据”按钮,如下图所示。

现在,你可以选择“加载”按钮以自动将数据加载到 Power BI 模型,或者选择“转换数据”按钮以启动 Power Query 编辑器。

在此编辑器中,你可以查看和清理数据,然后再将其加载到 Power BI 模型。我们通常建议对数据进行转换,此过程将在后续微课堂中介绍。

在本示例中,我们选择“加载”。


四、更改源文件

在开发过程中或者在文件存储位置发生更改的情况下,你可能必须更改数据源的源文件的位置。要使报表保持最新状态,你需要在 Power BI 中更新文件连接路径。

Power Query 提供了数据源设置、查询设置、高级编辑器等多种方法来完成此任务,因此你可以根据需要进行此类更改。

请注意:如果要更改文件路径,请确保重新连接到具有相同文件结构的同一文件。对文件进行的任何结构更改(如删除或重命名源文件中的列)都将破坏报表模型。

例如,尝试在数据源设置中更改数据源文件路径。选择 Power Query 中的“数据源设置”。在“数据源设置”窗口中,选择相应文件,然后选择“更改源”。更新“文件路径”或使用“浏览”选项查找文件,选择“确定”,然后选择“关闭”。



以上就是关于「从文件中获取数据」的全部内容。感谢您的耐心阅读,更多 Power BI 学习资源,请持续关注优阅达大数据生态。