社区
博客
利用 Xtract Universal,将 SAP 数据高效迁移至 Amazon S3 或 Redshift
以 Theobald SAP 集成工具为例,探讨 Xtract Universal 如何与两者集成,帮助企业从中选择满足需求的最佳目标平台。

在云数据管理领域,亚马逊云科技(Amazon Web Services)提供了多种存储和分析解决方案。其中,Amazon Redshift 和 S3 无疑是最受企业青睐的两个服务。

但是,对于想实现 SAP 数据提取和转移的企业来说,理解这两个服务之间的区别非常关键。

因此,本文将以 Theobald SAP 集成工具为例,探讨 Xtract Universal 如何与两者集成,帮助企业从中选择满足需求的最佳目标平台。

观看视频,了解 Theobald SAP 集成方案


Xtract Universal 如何实现 SAP 数据提取?

作为一款通用型工具,Xtract Universal 支持以下十种提取类型,帮助企业满足不同的 SAP 数据提取需求。如下图,你可借助这些组件从 SAP 系统提取数据至 Amazon 目标存储。

  • BAPI:访问 BAPI 和 RFC 功能模块。

  • BW Cube:从 SAP BW 信息立方体和 BEx 查询中提取数据。

  • BW Hierarchy:从 SAP BW/BI 系统中提取层级结构。

  • DeltaQ:从 ERP 和 ECC 系统提取数据源(OLTP)和提取器。

  • ODP:通过 SAP 操作数据提供(ODP)框架提取数据,适用于包括 CDS 视图、HANA 视图、BW/4HANA 对象、BW 提取器和 SLT 服务器等源对象。

  • Open Hub Services(OHS):提取 InfoSpokes 和 OHS 目标。

  • Query:提取 ERP 查询(SQ01 查询)。

  • Report:提取 ABAP 报告(T-Codes)。

  • Table:从 SAP 表和视图中提取数据,支持在 SAP 端连接多个表。

  • TableCDC:从 SAP 表中提取变更数据。

借助 Xtract Universal 中的多种组件,你可以高效地将 SAP 数据集成到 Amazon Redshift 和 S3 中,从而充分发挥各平台的优势。其中,Redshift 提供了高性能分析和快速查询的能力,而 S3 则为各种数据类型提供了可扩展且灵活的存储。

无论是即时分析还是长期存储和检索,这种组合都能最大化 SAP 数据的价值,让企业能够应对从实时洞察到大规模管理的各种需求,同时保持所需的灵活性和性能,以在数据驱动环境中保持竞争力。


Xtract Universal + Amazon Redshift = ?

Amazon Redshift 是一项完全托管且高性能的云数据仓库服务,专为大规模数据分析而设计。通过列式存储和大规模并行处理(MPP)架构,Amazon Redshift 能对结构化数据进行复杂查询并提供高速性能。

图示:Amazon Redshift 使用 SQL 在数据仓库、运营数据库和数据湖间分析结构化和半结构化数据,使用 AWS 设计的硬件和机器学习在任意规模提供最佳性价比。

在 SAP 数据提取过程中,Xtract Universal 与 Amazon Redshift 的协作方式如下:

》结构化的数据加载

👉 Xtract 组件简化了将 SAP 结构化和多维数据加载到 Redshift 中的过程,支持对大型数据集的分析和快速查询性能。

👉 SAP 数据可以有效地提取到 Redshift 中,以支持详细的运营报告和集中式数据仓库,包括财务记录、来自 InfoCubes 的销售数据和企业层次结构。

👉 Redshift 的列式存储和高性能功能增强了对 SAP 数据的深入分析和复杂查询。

》BI 工具的集成

Amazon Redshift 与 BI 工具的紧密集成,支持在数据传输后无缝进行数据可视化和报告,特别适用于实时分析和仪表板展示。

》数据转换

在 SAP 数据进入 Redshift 之前,Xtract 组件确保数据类型从 SAP ABAP 类型正确映射到 Redshift 数据类型。

》批量和实时加载

Redshift 支持批处理和近乎实时的数据加载,并通过 Xtract Universal 增强数据加载的效率。

所以,Amazon Redshift 的理想使用场景是:

  • 高性能分析:大量结构化数据需要快速查询响应。

  • 运营报告:基于 SAP 运营数据的汇总和详细报告。

  • 数据仓库:SAP 和非 SAP 数据的集中存储和分析。

关于 Amazon Redshift 如何进行 SAP 数据转换和管理,可点击查看《Theobald Xtract Universal 应用示例:从 SAP BW 提取表格数据到亚马逊云 Redshift》


Xtract Universal + Amazon S3 = ?

作为一款可扩展的对象存储服务,Amazon S3 对大规模数据存储进行了优化。它在数据耐久性、高可用性和成本效益方面表现出色,尤其适用于非结构化和半结构化数据。

图示:显示了如何将数据移动到 Amazon S3,管理存储在 Amazon S3 中的数据,以及利用其他服务分析数据。三个部分从左至右依次显示。

在 SAP 数据提取过程中,Xtract Universal 与 Amazon S3 的协作方式如下:

》灵活的数据存储

👉 Xtract 组件可将大规模数据从 SAP 系统传输到 S3,支持创建集中式数据湖,用于长期保留和未来处理。

👉 S3 可以存储各种形式的数据,从分层组织结构和自定义数据对象到来自 SAP BW 的多维数据和增量捕获的数据,适应不同的数据模型和需求。

👉 S3 存储解决方案可扩展且经济高效,优势在于能够高效管理大量 SAP 数据,确保数据可用于批量处理或按需分析。

》经济高效的存储

对于无需低延迟访问的数据,S3 提供了经济高效的存储解决方案,适合备份、日志或不常访问的历史数据。

》集成与数据移动

S3 是 ETL(提取、转换、加载)过程的理想中转区。Xtract Universal 可将数据暂存到 S3,然后通过亚马逊云服务(如 Glue 或 Lambda)将数据转换并移动到其他目标,包括 Redshift。

所以,Amazon S3 的理想使用场景是:

  • 大数据存储:存储大量的 SAP 数据,用于批处理和大数据分析。

  • 数据归档:长期存储 SAP 报告、日志和历史数据。

  • ETL 中转区:在数据被转换并转移到其他数据库或数据仓库之前的中间存储区域。

关于 Amazon S3 如何进行 SAP 数据转换和管理,可点击查看《Theobald Xtract Universal 应用示例:从 SAP S4/HANA 提取 BW Cube 到亚马逊云 S3》


Redshift 与 S3 在数据处理方面的差异

企业在为 SAP 数据存储选择方案时,关键是要理解这两者的差别,包括每种服务在数据结构和访问性方面的处理方式,以及对于成本和性能的考虑。

》数据结构与可访问性

  • Amazon Redshift 针对结构化数据进行了优化,适合数据加载后立即分析的场景。

  • Amazon S3 可处理结构化和非结构化数据,但不适合直接查询,而是用作存储原始数据的解决方案。

》成本与性能

  • Amazon Redshift 通常因其高性能而成本较高,适用于查询速度和性能关键的环境。

  • Amazon S3 则提供经济高效的存储,适合访问频率较低或用于备份和归档的数据。

总的来说,要选择 Amazon Redshift 还是 Amazon S3 作为 SAP 数据提取的目标平台,取决于企业的需求和具体情况。

如上文所述,Amazon Redshift 适用于需要快速分析结构化数据的场景,提供强大的查询功能以支持详细的操作报告和业务智能。而 Amazon S3 在需要可扩展、经济的存储解决方案时表现优异,特别适用于归档或作为更广泛的 ETL 流程或数据湖策略的一部分。


结语:免费试用 Xtract Universal

无论是哪个目标环境,Theobald Xtract Universal 都能帮助企业轻松实现 SAP 数据集成,从而实现更加灵活、有效的 SAP 数据管理与分析。

如果你正在寻找一款简单、易用、安全、高性价比的 SAP 集成方案,可申请免费试用 Xtract Universal,或通过联系我们咨询哦~


获取最新的数据新闻

注册以获取 优阅达 Data Blog 的快讯、见解和研究