Elastic与Red Hat:利用NVIDIA® GPU加速扩展主权AI工厂
Elastic 在 cuVS 上借助 NVIDIA GPU 实现性能加速,并结合 Red Hat AI 的灵活性,共同为主权 AI 工厂提供有力支撑,助力您在任意环境中落地企业级 RAG 与智能体 AI 工作流。
.png)
总结
- Elastic 与 NVIDIA cuVS 结合的向量索引现已可在 Red Hat AI 平台上的 OpenShift 中使用。
- Elasticsearch、Red Hat AI 与 NVIDIA 的集成,可为组织提供一个兼容原生 Kubernetes 工作负载的全面平台。
- GPU 加速搜索与高性能计算相结合,可在混合云环境中实现安全且可扩展的 RAG 部署。
随着生成式 AI 解决方案迈过试点阶段,企业正转向 AI 工厂,以获得可标准化、可复用的基础架构,从而支持 AI 工作负载的大规模运行。一个可用于生产环境的 AI 工厂,应具备强大的模型、用于提供上下文的实时知识检索、智能体推理能力,以及保障专有数据安全的防护机制。
组织需要这些 AI 解决方案能够在其业务运营的任何地方运行:本地部署、云端或混合环境。
Elastic 和 Red Hat 携手,正在实现这一目标。Elastic 与 NVIDIA cuVS 的 GPU 加速向量搜索现已可在 Red Hat AI 平台上的 OpenShift 中使用。这一合作为企业提供了可用于生产环境的基础能力,使其能够在满足数据主权要求的环境中部署可扩展搜索、检索增强生成(RAG)和 AI 智能体。
从 RAG 到智能体 AI,索引速度为何至关重要
成功的企业AI部署能够从数PB的非结构化专有公司数据中获取上下文。在这些 RAG 管道的核心是向量搜索。然而,随着数据量的增长,构建这些向量索引常常成为一个瓶颈,阻碍了部署并导致高额的开销成本。
通过集成NVIDIA cuVS 以实现 GPU 加速索引,Elastic 可将摄取过程中的计算密集型任务交由 GPU 处理。效果十分显著:
索引速度最高可提升 12 倍
强制合并速度最高可提升 7 倍
降低 CPU 使用率
作为 NVIDIA Enterprise AI Factory 验证设计中推荐的向量数据库,Elastic 为自主智能体提供关键引擎,使其能够基于最相关的数据高效推理并采取行动。索引加速后,您的智能体便可基于企业实时数据,在大规模场景下快速作出决策。
Red Hat AI 是承载 Elastic GPU 加速能力的理想平台
Red Hat AI 提供企业所需的 Kubernetes 原生基础架构,帮助企业落地 AI 工作负载,覆盖从模型训练的数据检索到推理的完整流程。结合 NVIDIA 加速能力的 Elastic 与 Red Hat AI 技术栈,可为优先考虑主权 AI 的客户补齐关键能力缺口。
通过使用 Elastic Agent Builder 和 Elastic Workflows,开发人员现在可以在其 Red Hat AI on OpenShift AI 中构建自主代理。这些代理将在您的混合云中检索信息,并触发操作工作流,同时将您的数据和模型保留在您的环境中。
红帽生态系统开发高级总监 Katie Giglio 表示:“Red Hat OpenShift 为企业在任何混合云环境中实现 AI 工作负载的落地运行与规模扩展提供了关键的 Kubernetes 原生基础。”“通过在 Red Hat OpenShift 和 Red Hat AI 上启用 Elastic 的 GPU 加速搜索,并借助 NVIDIA 的加速能力,我们正携手交付一个生产就绪的开放平台,帮助客户构建安全、高性能的 RAG 与自主 AI 智能体,同时完全掌控其数据主权。”
可在任意环境部署,数据始终由您自行掌控
Elastic 与 Red Hat 和 NVIDIA 的合作,使受严格数据主权监管的组织能够灵活管理数据,无论数据分布在何处。
Red Hat AI 提供了托管和保护模型的基础。
Elastic 提供上下文层和智能体框架。
NVIDIA AI 基础架构提供性能加速。
双方共同客户可无缝部署智能体 AI 系统,并落地 AgentOps 实践
Elastic 与 Red Hat AI 相结合,可确保专有业务数据和模型部署在您选择的环境中:自有数据中心、云区域或混合架构。
Elastic 和 Red Hat AI 的实际应用场景
以一家面临监管复杂性和基础架构成本的金融机构为例,该金融机构正在应对部署面向客户的 AI 助手所带来的挑战。要真正发挥作用,该 AI 助手必须以智能体形式运行,能够实时检查客户账户信息并标记可疑活动。
借助 Red Hat AI 平台上的 Elastic GPU 加速搜索,这家金融机构现在可以:
在客户记录更新时,对新增相关数据的索引速度最高可提升 12 倍
- 运行自主智能体,在数百万个向量中搜索,检索相关上下文并实时采取行动
- 在单一托管平台上部署并扩展其完整的 AI 流水线
- 在确保安全的同时,始终完全掌控数据主权
开始使用 Elastic on Red Hat AI
支持 GPU 加速的 Elasticsearch 现已可在 Red Hat AI 平台上使用。无论您是在构建首个 RAG 应用,还是在全球范围内部署 AI 工厂,Elastic、Red Hat 与 NVIDIA 的组合都能基于开源基础,为现代 AI 解决方案提供所需的性能与灵活性。
本文中描述的任何功能或功能性的发布和时间均由 Elastic 自行决定。当前尚未发布的任何功能或功能性可能无法按时提供或根本无法提供。
在本博文中,我们可能使用或提到了第三方生成式 AI 工具,这些工具由其各自所有者拥有和运营。Elastic 对第三方工具没有任何控制权,对其内容、操作或使用不承担任何责任或义务,对您使用此类工具可能造成的任何损失或损害也不承担任何责任或义务。请谨慎使用 AI 工具处理个人、敏感或机密信息。您提交的任何数据都可能用于 AI 训练或其他目的。Elastic 不保证您所提供信息的安全性或保密性。在使用任何生成式 AI 工具之前,您都应自行熟悉其隐私惯例和使用条款。
Elastic、Elasticsearch 及相关标志是 Elasticsearch N.V. 在美国和其他国家/地区的商标、徽标或注册商标。所有其他公司和产品名称均为其相应所有者的商标、徽标或注册商标。