了解数据市场
- 版本 :2023.1(当前版本)
了解数据市场
本文介绍并说明需要了解的有关数据市场的重要概念。
数据市场提供一个语义层,该层自动生成并与数据市场表的内容、其结构和基础数据同步,所有这些内容均提供在自动生成的数据集中。 通过这种自动生成和同步,你可以使用层次结构、易记名称和说明等进一步描述数据域,以及设置特定于区域设置或业务需求的格式。 借助数据市场,还可以创建用于报表的度量值和标准化指标。 Power BI(以及其他客户端工具)可以创建视觉对象,并根据上下文中的数据为此类计算提供结果。
从数据市场创建的自动生成的 Power BI 数据集消除了连接到单独的数据集、设置刷新计划以及管理多个数据元素的需求。 相反,你可以在数据市场中构建业务逻辑,其数据将立即在 Power BI 中可用,从而实现支持以下功能:
通过数据集中心访问数据市场数据
在 Excel 中进行分析的功能
快速在 Power BI 服务中创建报表的功能
无需刷新、同步数据或了解连接详细信息
无需 Power BI Desktop 即可在 Web 上构建解决方案
在预览版期间,自动生成的数据集连接仅适用于 DirectQuery。 下图展示了数据市场在从连接到数据开始一直到创建报表的过程连续性中的作用。
自动生成的数据集在以下方面不同于传统的 Power BI 数据集。
XMLA 终结点支持只读操作,用户不能直接编辑数据集。 自动生成的数据集没有数据源设置,用户无需输入凭据。 相反,它们针对查询使用的是自动单一登录 (SSO)。 对于刷新操作,数据集会使用数据集作者凭据来连接托管数据市场的 SQL 终结点。
借助 Power BI Desktop,用户可以生成复合模型,从而实现连接到数据市场的数据集并执行以下操作:
选择要分析的特定表
添加更多数据源
最后,如果不想直接使用自动生成的数据集,则可以连接到数据市场的 SQL 终结点。 有关详细信息,请参阅使用数据市场创建报表。
了解增量刷新和数据市场
与数据流和数据集增量刷新类似,你可以使用数据市场编辑器创建和修改增量数据刷新。 增量刷新通过为经常加载新数据和更新数据的数据市场表提供自动化分区创建和管理功能,扩展了计划的刷新操作。
对于大多数数据市场来说,增量刷新将涉及一个或多个包含事务数据的表,这些数据经常发生变化,并可能呈指数级增长,例如关系数据库或星型数据库架构中的事实数据表。 使用增量刷新策略对表进行分区,以及仅刷新最新导入分区可以显著减少必须刷新的数据量。
适用于数据市场的增量刷新和实时数据具有以下优势:
对于快速变化的数据,刷新周期更少
刷新速度更快
刷新更可靠
资源消耗更少
支持创建大型数据市场
易于配置
了解主动缓存
主动缓存支持自动导入自动生成数据集的基础数据,因此无需管理或协调存储模式。 自动生成数据集的导入模式使用快速 Vertipaq 引擎为 Datamart 的数据集提供性能加速。 利用主动缓存,Power BI 更改要导入的模型的存储模式,该模式使用 Power BI 和 Analysis Services 中的内存引擎。
主动缓存按以下方式工作:每次刷新后,自动生成数据集的存储模式都会更改为 DirectQuery。 主动缓存以异步方式生成并排导入模型,由数据市场管理,且不会影响数据市场的可用性或性能。 自动生成数据集完成后传入的查询将使用导入模型。
数据市场中未检测到任何更改后,大约 10 分钟内会自动生成导入模型。 对导入数据集所做的更改包括以下内容:
刷新
新数据源
架构更改:
新数据源
Power Query Online 中数据准备步骤的更新
任何建模更新,例如:
度量值
层次结构
说明
主动缓存的最佳做法
使用部署管道进行更改以确保最佳性能,并确保用户使用导入模型。 使用部署管道已是构建数据市场的最佳做法,但这样做可以确保利用主动缓存优势的频率。
主动缓存的注意事项和限制
Power BI 当前将缓存操作持续时间限制为 10 分钟。
特定列的唯一性/非 null 约束将在导入模型中强制执行,如果数据不符合,缓存构建便会失败。