数据市场简介

  • 版本 :2023.1(当前版本)

数据市场简介

业务用户严重依赖由信息技术团队 (IT) 生成的集中治理的数据源,但 IT 部门可能需要数月时间才能针对给定数据源进行更改。 作为回应,用户经常使用 Access 数据库、本地文件、SharePoint 站点和电子表格生成自己的数据市场,从而导致缺乏治理和适当监督,无法确保此类数据源得到支持并具有合理的性能。

数据市场有助于弥合业务用户和 IT 之间的差距。 数据市场是自助式分析解决方案,使用户能够存储和浏览完全托管数据库中加载的数据。 数据市场提供了一种简单且可选的无代码体验,可以从不同数据源引入数据,使用 Power Query 提取转换和加载 (ETL) 数据,然后将其加载到完全托管且无需调整或优化的 Azure SQL 数据库中。

将数据加载到数据市场后,还可以为商业智能和分析定义关系和策略。 数据市场自动生成数据集或语义模型,可用于创建 Power BI 报表和仪表板。 还可以使用 T-SQL 终结点或使用视觉体验来查询数据市场。

Diagram that shows datamarts and power B I relationship.

数据市场具有以下优势:

  • 自助服务用户可以轻松执行关系数据库分析,而无需数据库管理员

  • 数据市场通过 SQL 提供端到端的数据引入、准备和浏览,包括无代码体验

  • 支持在一个整体体验中生成语义模型和报表

数据市场功能:

  • 100% 基于 Web,无需其他软件

  • 无代码体验,提供完全托管的数据市场

  • 自动性能优化

  • 用于临时分析的内置视觉对象和 SQL 查询编辑器

  • 支持 SQL 和其他常用的客户端工具

  • 与 Power BI、Microsoft Office 和其他 Microsoft 分析产品/服务的本机集成

  • 包含在 Power BI Premium 容量和 Premium Per User 中

何时使用数据市场

数据市场针对自助式方案的交互式数据工作负载。 例如,如果你从事会计或财务工作,则可以生成自己的数据模型和集合,然后可以使用它们通过 T-SQL 和视觉对象查询体验自助处理业务问题和获取答案。 此外,你仍可以将这些数据集合用于更传统的 Power BI 报表体验。 对于需要面向域、去中心化的数据所有权和体系结构的客户,例如需要将数据用作产品或自助式数据平台的用户,建议使用数据市场。

数据市场旨在支持以下方案:

  • 部门自助式数据:将中小型数据量(大约 100 GB)集中在一个自助式完全托管 SQL 数据库中。 使用数据市场,可以为自助服务部门下游报表需求(例如 Excel、Power BI 报表等)指定单个存储,从而减少自助式解决方案中的基础结构。

  • 使用 Power BI 进行关系数据库分析:使用外部 SQL 客户端访问数据市场的数据。 Azure Synapse 和其他使用 T-SQL 的服务/工具也可以在 Power BI 中使用数据市场。

  • 端到端语义模型:使 Power BI 创建者能够生成端到端解决方案,而无需依赖于其他工具或 IT 团队。 数据市场通过自动生成的数据集避免了在数据流和数据集之间管理业务流程,同时为查询数据和临时分析提供了视觉对象体验,所有这些都由 Azure SQL DB 提供支持。

下表介绍了这些产品/服务和每个产品/服务的最佳用途,包括它们在数据市场中的作用。

推荐用例与数据市场互补
数据市场基于用户的数据仓库和对数据的 SQL 访问数据市场可用作其他数据市场或项的源,并使用 SQL 终结点执行以下操作:
  • 外部共享

  • 在启用安全性的情况下跨部门或组织边界共享

数据流数据集或市场的可重用数据准备 (ETL)数据市场为 ETL 使用单个内置数据流。 数据流可以强调这一点,从而实现:
  • 使用不同的刷新计划将数据加载到数据市场

  • 将 ETL 和数据准备步骤与存储分离,以便数据集可以重复使用

数据集BI 报表的指标和语义层数据市场为报表提供自动生成的数据集,从而实现:
  • 合并来自多个源的数据

  • 选择性共享数据市场表以生成精细报表

  • 复合模型 - 包含来自数据市场和数据市场外其他数据源的数据的数据集

  • 代理模型 - 使用 DirectQuery 自动生成模型的数据集,使用单一事实来源

数据市场和数据流集成

在某些情况下,在同一解决方案中结合使用数据流和数据市场可能很有用。 这种做法适用于以下情况:

  • 对于使用现有数据流的解决方案:

    • 通过数据市场轻松使用数据来应用任何其他转换,或使用 SQL 查询启用即席分析和查询

    • 轻松集成无代码数据仓库解决方案,无需管理数据集

  • 对于使用现有数据市场的解决方案:

    • 针对大型数据卷大规模执行可重用的提取、转换和加载 (ETL)

    • 自带数据湖,并将数据流用作数据市场管道

Diagram that shows datamarts and dataflows and power B I relationships.

将数据流与数据市场进行比较

本部分介绍数据流和数据市场之间的差异。

数据流提供可重用的提取、转换和加载 (ETL)。 没有数据集就无法浏览、查询或探索表,但可以定义表以供重复使用。 如果自带数据湖,数据将以 Power BI 或 CDM 格式公开。 Power BI 使用数据流将数据引入数据市场。 每当想重用 ETL 逻辑时,都应使用数据流。

需要执行以下操作时使用数据流:

  • 为 Power BI 中的项生成可重用和可共享的数据准备。

数据市场是一个完全托管的数据库,使你能够在完全托管的关系型 Azure SQL DB 中存储和浏览数据。 数据市场提供 SQL 支持、无代码视觉对象查询设计器、行级别安全性 (RLS),并为每个数据市场自动生成数据集。 可以在 Web 上执行临时分析和创建报表。

需要执行以下操作时使用数据市场:

  • 以可视化方式或通过 SQL 中定义的表达式进行排序、筛选、简单聚合

  • 对于结果、集、表和筛选的数据表的输出

  • 通过 SQL 终结点提供可访问的数据

  • 使无权访问 Power BI Desktop 的用户可以进行访问