Data² 由美国退伍军人和尖端技术领域公认的思想领袖、众多高级研究生学历组成的团队创立 (SDVOSB),它利用高级分析、数据科学、机器学习 (ML) 和人工智能 (AI) 功能,帮助组织充分发挥其数据潜力。
Data² 的使命是改变国防、情报和能源组织从结构化和非结构化数据中提取见解的方式。它利用领域专业知识与生成式 AI 技术,助力分析师实现更深层次的发现和决策优化。从发现恐怖组织到解开和优化复杂的井网,基于 Neo4j AuraDB 的知识图的 Data² reView 使分析师能够自信地做出高风险决策。
Data² reView 将 Neo4j 知识图与生成人工智能配对
Data² 首席技术官 Jeff Dalgliesh 说:“我们知道,当我们开始构建 reView 时,我们需要采取不同的方法。”“我在油田亲眼看到,最有价值的信息存在于非结构化来源,如钻探报告、设施记录和维护日志。”
Dalgliesh 发现,关系数据库很难分析这些大型数据集中的复杂关系。Data² 需要一种更具可扩展性的技术来为其新兴的分析平台提供动力,能够快速为生成性人工智能开发提供基础。2023年,Indigo Advisory 估计,仅能源部门的人工智能市场价值就高达 130 亿美元,其中 GenAI 占人工智能总支出的 28.1%。
为什么关系数据库和三元存储不足够
Data² 在其研发阶段探索了许多技术,整合 Spark、triple stores、Hadoop集群和索引等组件对不断壮大的团队来说是一项艰巨的任务。这些技术需要专业知识和耗时的配置,这减缓了开发速度。
Dalgliesh 解释说:“我们发现,有了 Neo4j,我们不需要担心幕后的所有混乱。”“图形技术帮助我们专注于构建人工智能能力,而不陷入数据库管理和扩展的中。”
Neo4j 知识图可视化了互连网络中的节点和关系
Dalgliesh 也对集成 Neo4j 的 GraphRAG 功能感兴趣。GraphRAG 结合了知识图、数据科学、大型语言模型(LLM)和检索增量生成(RAG),为用户查询提供更准确的响应。
Dalgliesh 说:“石油和天然气是一个由流程、人员和基础设施组成的互联网络。”“我们正在与一位正在模拟盐水处理井的客户合作。如果你转动一个减少管道流量的阀门,它会对处置井产生下游影响。在 Neo4j 上构建的知识图是模拟这种复杂网络关系的完美抽象层,比三元存储更适合重新查看。”
Dalgliesh 在 reView 开发过程的早期就排除了三元存储。三元存储是一种旨在存储三重的数据库,它是主题-谓词-宾语的组合,如“ Bob 是 35 岁”或“ Bob 认识 Fred ”。“主体”的每个属性都必须将其建模为自己的三元。随着三元数量的增加,这种方法可能会导致性能问题,使高效查询和分析大型数据集变得困难。
Dalgliesh 说:“三元存储往往更关注本体,而不是解决现实世界的问题。”“他们是学者,对精确性持严格要求。但是,当你试图快速理解一个混乱的领域时,你需要一个灵活的模型来帮助你快速解决业务问题。”
GraphRAG 为分析师提供可跟随的纸质线索
今天,Data² reView通过存储在 Neo4j AuraDB 图数据库中的知识图呈现客户数据。Dalgliesh 的团队开发了几个组件,以提高 reView 的准确性并增强分析师的用户体验:
- Arctic Loader
Data² 构建了此组件,将表格数据和文档加载到其知识图中,并将图表映射到图结构中。
- 问答系统
用户可以提问并接收准确的答案(存储在图表中),由 Neo4j GraphRAG 和 Anthropic 或其他 LLM 提供支持。
- 证据和问题图
Data² 为证据和问题维护单独的图表,防止其语言模型摄取不正确的数据。
reView 的问答系统,由 Neo4j GraphRAG 提供支持
分析师现在能够对拥有数万个节点的数据集进行审查,并从 GenAI 问答系统以通俗易懂的英语接收答案。用户可以深入研究支持每个答案的证据,并接受结果作为训练数据,或将其标记为人工校正,以提高模型的准确性。
首席业务官 Eric Costantini 说:“分析师需要能够准确地剖析人工智能是如何得出特定结论或建议的。”“ Neo4j 使我们能够通过在子图级别应用访问控制来强制执行强大的信息安全。”
问题变得更具体和有针对性,但答案仍准确和透明
Dalgliesh 解释说:“你问的问题越好,你就越聪明。”“我们认为知识图是一个动态的、不断发展的大脑,它捕捉到了一个组织运营知识的全部范围。我们的生成性人工智能代理在这个大脑上学习和推理,以提供基于数据的上下文相关见解和建议。”
发现更好的战略投资组合,适合 O&G 租赁收购和隐藏的安全威胁,具有“进化的大脑”。将知识图和 GraphRAG 纳入 reView 使 Data² 能够发现客户数据中的隐藏模式。
情报机构可以快速聚焦高价值调查目标,分析相关的生活模式数据,并识别隐藏的威胁网络。这种创新的整合提供了对动态环境的全面理解,赋予决策者无与伦比的洞察力,以加强战略运营和保障其国家安全。
Data² 将人类智能与金融智能联系起来,以发现隐藏的行为者网络
石油和天然气高管在评估从油田到钻探地点的新投资组合收购时,可以使用 reView 做出更好的决策。reView 的人工智能产品简化了评估租赁、整合关键地质、生产和经济数据的任务,这让领导者能够更自信地做出更明智的选择。
从油井的建设和维护记录中提取的设备操作问题的可视化,是 Data² 的油井估值和性能模型的一部分
操作数据很难获得。上图可视化了从油井的施工和维护记录中提取的设备问题。这些证据通常被埋没在没有人有时间找到或联系的报告中。Neo4j 与 reView 的 LLM 驱动的事实提取器相结合,使时间和资源有限的团队能够构建高度具体的领域知识图。
Data² 使用生成人工智能重新定义防御
2023 年 8 月,美国国防部宣布成立一个生成性人工智能工作组,以评估和利用整个国防部的 GenAI 能力。对于 Data² 团队及其客户来说,知识图只是人工智能驱动未来的开始。
Dalgliesh 解释说:“Neo4j 使我们的用户能够轻松地与知识图进行交互和探索,并实现以前方法无法实现的任务成果。”“两个节点之间的距离可能包含一个有助于使世界变得更安全的答案。”
Neo4j 图数据库平台帮助企业深入、轻松、快速地发现数十亿数据连接中隐藏的关系和模式。客户利用他们连接的数据的结构来揭示解决他们最紧迫的业务问题的新方法,从欺诈检测、客户 360、知识图谱、供应链、个性化、物联网、网络管理等等。
后续,我们还将介绍更多 Neo4j 产品功能及行业应用场景。
Neo4j 产品分为社区版和企业版,具体需求可随时与我们联系。