在上篇资讯中,我们初步认识了创新数据引擎 Tableau Semantics(语义层),及其如何帮助企业高效、精准地进行数据查询和建模。目前,Salesforce Data Cloud、Agentforce 及下一代分析平台 Tableau Next 都采用了语义层技术。
为更进一步了解 Tableau Semantics,本文整理了来自 Salesforce 工程博客对其软件工程首席架构师 Lior Ebel 的访谈,他负责带领团队开发 Salesforce 的语义层技术,即 Tableau Semantics。
在本次访谈中,Lior Ebel 首度披露了技术团队面临的三大攻坚课题:如何应对优化大规模语义查询、集成 AI 实现直观的数据建模,及确保系统扩展性的同时保持信任与安全性等关键挑战,旨在帮助企业更加智慧、精准、大规模地实现数据驱动型决策。
Q1:团队的使命是什么?
我们团队致力于为企业提供统一且直观的数据建模与分析方式,核心工作是持续推进 Tableau Semantics,这也是 Tableau Next 中进行数据查询和建模的关键引擎;首要目标是简化企业定义数据关系和业务指标的方式,创建出一个统一的可信数据来源,提供一致可靠的洞察。
通过语义数据模型(Semantic Data Models, SDMs),用户可以用更直观、更高级的方式建立数据模型。这种方式极大降低了传统 SQL 查询的复杂性,加快了数据驱动型应用的开发速度。语义层查询引擎则基于 SDM 定义,将用户查询高效地转换为对应的 SQL 语句。
如下图所示,Tableau Semantics 将用户给出的高级语义化查询转化为具体的 SQL 语句。
上半部分,是用户通过简单的语义描述方式提出的数据需求,包括希望查询投资回报率、订单和产品类型名称等字段,同时希望按照产品类型和产品类型名称进行分组统计,并设置过滤条件(ROI 大于100)。
下半部分展示了 Tableau Semantics 内部将上述语义请求自动翻译成了具体的 SQL 查询语句。在生成的 SQL 中,系统通过清晰定义的聚合计算公式计算出具体的 ROI 值,即总收入减去总成本再除以总成本。
同时,为满足用户请求的数据关联需求,系统自动进行了多个 INNER JOIN 操作,将订单表与产品表、客户表以及产品销售表进行了连接,随后再通过 GROUP BY 和 HAVING 语句实现数据分组与筛选,从而准确、快速地提供所需的查询结果。
此外,我们团队还应用生成式 AI 等前沿技术,整合了 AI 驱动的智能体(Agent)和自然语言处理能力,让用户无需具备深厚的技术背景,就能通过对话式查询数据。我们最终的目标是让数据变得易于获取、便于应用并真正有价值,同时确保提供顺畅、智能且可扩展的分析体验。
Q2:近期遇到的最大技术挑战是什么?
我们团队最近遇到的最大技术挑战之一,是确保语义层查询在面对 B2C 级别海量数据时,仍然能快速准确地运行。
为了解决这个问题,团队选择采用基于 SQL 生成器的方式来实现语义层的查询执行引擎,而非自建一个全新的查询处理器。这项战略决策让我们能充分利用底层数据仓库的扩展性和优化能力,避免重新进行性能调优工作。
此外,我们特别注重优化语义层生成的 SQL 查询。通过采用高效表连接(joins)、提前应用过滤条件、简化查询复杂性等 SQL 设计最佳实践,同时在开发早期就对 SQL 模式进行反复测试和优化,主动识别和解决潜在的性能瓶颈。
这种架构设计与 SQL 优化的双重聚焦,让我们能驾驭 B2C 级别的大规模数据,交付快速、可靠且可扩展的分析能力,使非技术用户也能以简单直观的方式获取高效、准确的数据洞察。
结合上图来看 Tableau Semantics 在数据分析流程中扮演的角色和工作原理,整体结构分为三大部分:
👉 首先,最右侧的是用户端的 BI 与 AI 工具(如 Tableau 和 Tableau Next 等)。用户通过这些工具发起数据分析请求。
👉 中间就是 Tableau 语义层,包含两个核心部分:
上方为语义数据模型,用于定义企业的数据模型与业务指标,使数据更贴近真实业务场景;下方为语义查询引擎,接收到用户端的分析请求后,结合语义数据模型中定义的数据关系和业务指标,将请求转换为可执行的 SQL 查询。
👉 左侧是底层的数据层,这里实际存储着数据。数据层接收语义查询引擎转换出的 SQL 查询,并执行数据库操作,最终将查询的结果返回给语义查询引擎。
完成数据查询后,Tableau Semantics 再将分析结果返回给右侧的 BI 与 AI 工具,呈现给用户使用,实现数据分析和决策支持。而最底部的 Data Cloud 则体现了整个流程的底层架构平台,保证了各组件之间高效、安全的数据交互。
Q3:如何应对扩展性带来的挑战?
扩展性带来了多个复杂挑战,包括数据体量的持续增长、客户使用量的攀升、查询负载激增,以及更多团队与系统进行交互,每一种情况都需要针对性制定策略。
在系统负载管理方面,采取自上而下与自下而上的双重路径。在设计与规划阶段,通过团队协作与专业经验预判并规避瓶颈;在开发过程中辅以压力测试,通过模拟高负载场景发现潜在瓶颈。这种主动防御机制确保系统具备应对突发规模扩展的能力。
针对多团队协作挑战,我们以系统稳定性与可用性为核心。通过完善的技术文档、直观的 API 接口和自助式服务设计,使内部和外部团队都能自主扩展使用规模。这种架构设计既降低了直接支持需求,又保障了性能与可用性标准的持续达成。
Q4:有哪些提升项目能力的研发方向?
我们正着力将 AI 深度融合到语义层中,为 Salesforce 创造更智能、更具扩展性的数据体验。
在过去一年里,我们重点推进语义数据模型(SDM)建设,以支持自主化和辅助式 Agent 的使用体验。通过将 AI 工具与企业特定的业务定义相结合,确保 AI 在响应数据查询时保持一致性、准确性,并与企业特有指标体系对齐,从而减少大语言模型(LLM)产生幻觉等问题。
此外,AI 技术也正被用于优化语义建模流程。AI 辅助工具可提供业务逻辑定义的最佳实践建议以及推荐高效的数据模型结构,帮助团队在复杂度攀升时持续优化语义数据模型开发流程。
例如,当用户通过自由地输入文本并提出“请创建一个 ROI 字段”,Tableau Semantics 便能自动推荐适合计算投资回报率的公式。
将语义层定位为 AI 赋能的智能基座,可实现更智慧的决策支持。通过不断增强这些能力,我们能确保整个 Salesforce 生态系统中的分析体验更加可靠且直观,使企业更有信心地采取数据驱动型决策。
Q5:如何平衡快速部署需求与信任安全标准?
在 Salesforce 服务的企业级客户特性下,平衡项目快速部署需求与信任安全标准是核心命题。我们将信任安全机制深度植入开发全流程,依托 Salesforce 坚实的技术基座实现快速部署与安全防护的有机统一。
语义层构建于 Hyperforce 架构之上,此架构抽象封装了安全合规的复杂性。借力这样的基础设施,我们无需重复构建安全防护体系,天然具备部署速度与系统可靠性的双重优势。稳固的基座工程是维持高标准安全的第一道防线。
除了基础设施以外,严格的质量保障与验证流程也至关重要。每次发布版本前都要经过全面且深入的测试,以确保达到最高标准。正是依靠值得信赖的基础设施与严格的测试流程,我们才能够实现快速开发,同时将安全性和客户信任作为最高优先级。
Q6:如何收集用户反馈并指导产品迭代?
语义层主要服务两大核心群体:一类是外部用户,他们将语义层作为产品直接使用;另一类是内部用户,即在工作流程中使用语义层的 Salesforce 开发者。
针对外部用户,产品团队与关键客户保持持续对话机制,通过深度需求调研收集反馈,优先解决最紧迫的痛点问题,确保产品演进始终与用户需求同频共振。
内部用户(如商业智能应用开发者)则通过开放的沟通渠道提供反馈。比如 Slack 平台支持异步反馈,必要时召开面对面沟通会议。软件开发本质是围绕人的创造活动,理解开发者与终端用户的双重挑战,才能构建真正有效的解决方案。事实上,最具价值的技术攻坚往往源自用户痛点,因为这些正是用户无法自行突破的困境。
用户反馈深度影响着开发优先级排序,能帮助我们持续提升产品在实际使用场景中的价值。但同时,我们也强调积极主动的创新,这使我们能预判未来需求,突破既有的用户需求边界,推动产品能力的持续提升。
快速入门 Tableau 语义层
通过简化数据访问、保障一致性及促进协作,Tableau Semantics 让企业中的每位员工与 AI Agent 都能轻松获取数据驱动的业务洞察。
👉 想要使用 Tableau Next 中的 Tableau Semantics 功能,请通过 Tableau+ 高级套件订阅服务。
这款套件包含了 Tableau AI 最新功能(如 Tableau Next、Pulse 指标洞察增强功能 和 Tableau Agent 对话式 AI 助理)、企业数据治理组件和高级的客户支持服务。
👉 如果你对 Tableau AI 感兴趣,也可观看 Webinar 视频回放!你将全面了解 Tableau Cloud,并感受 Tableau AI 如何助力企业智能分析与洞察,从而推动数据民主化发展。