Elastic 携手 NVIDIA cuVS,助力企业级 AI 大规模落地。

依托 GPU 加速向量搜索这一全新黄金标准,无缝实现海量数据向量化,加速生产落地。

image2.png
总结
  • Elastic 已与 NVIDIA 合作启动由 NVIDIA cuVS 提供支持的 GPU 加速向量索引
  • 集成于 NVIDIA AI Factory 验证设计中的 Elasticsearch,可为 AI 应用加速提供一套经过验证的全栈预构建蓝图。
  • 企业能够对海量非结构化数据进行向量化,速度最高可比基于 CPU 的方法快 12 倍

各组织正大力投资 AI。但要真正释放业务价值,您需要一套基础架构:不仅能够存储海量数据,还能快速搜索并检索相关上下文。此外,您还需要能够推理、学习、回答问题并采取行动的系统,而不仅仅是返回搜索结果。

借助 NVIDIA cuVS GPU 加速,Elastic 向量索引可突破企业级 AI 规模化部署的关键瓶颈:将海量非结构化数据向量化,为现代 AI 解决方案提供精准、实时的上下文。

前沿人工智能

企业正进入 AI 应用的新阶段,其中非结构化数据的激增使传统搜索难以有效提取洞察。因此,组织正转向高性能向量数据库和语义搜索,以支撑现代 AI 应用,例如生成式 AI(GenAI)、检索增强生成(RAG)和 AI 智能体。

同时,各组织正在建造 AI 工厂,以简化 AI 部署、扩展性能,并最大限度地提高 GPU 的效率和容量。这一集成技术栈融合了加速计算与高性能向量搜索,是将前沿 AI 高效交付给消费者和企业的理想路径。

高效 AI 是否可行?

大型企业在构建内部生成式 AI 平台时,若需高效索引并检索 PB 级企业数据的上下文,成本便会迅速成为核心关切。这些 AI 工厂需要尽可能利用一切优势,降低高成本工作负载带来的压力。

同样,希望扩展向量搜索能力的组织,往往难以在不线性增加 CPU 硬件投入的前提下实现这一目标。构建高性能向量数据库时面临一项关键难题:向量索引(HNSW 图)需在 CPU 上完成。在对每个向量进行比较时,索引构建可能会迅速膨胀为数百万甚至数十亿次算术运算。随之而来的,就是摄取环节的瓶颈。再叠加压缩、合并等索引生命周期操作,计算开销还会显著上升。

成本优化的向量基础架构

为帮助您克服这些挑战,Elastic 与 NVIDIA 正携手推进建设 Elastic AI 生态系统。借助 GPU 加速向量搜索和强大的 AI 基础架构,双方正重新定义企业构建和扩展 AI 工厂的方式,推动下一代实时智能加速落地。

通过融合 NVIDIA Enterprise AI Factory 验证设计与 Elasticsearch 强大的向量数据库,组织便能以安全、企业级可扩展的方式,为 AI 智能体和 GenAI 应用提供更深入的洞察与实时、相关的数据。

借助 Elastic 与 NVIDIA,您将获得专为现代 AI 打造的强大向量数据库——高性能、功能丰富,且支持 GPU 加速。

GPU 加速可有效消除 CPU 侧的摄取瓶颈。

以下是您可以通过此次整合获得的一些好处。

加速部署

利用全栈预构建系统构建本地 AI 工厂,显著缩短投产周期。Elasticsearch 是 NVIDIA Enterprise AI Factory 验证设计中经过验证且受支持的向量数据库,为部署智能体 AI 应用提供可靠支撑。

快速高效的索引

更高效地处理指数级增长的向量嵌入和海量数据。将 NVIDIA cuVS 集成到 Elasticsearch 中,索引吞吐量提升近 12 倍,强制合并速度提升 7 倍。

Elasticsearch 向量数据库 + NVIDIA cuVS 成就强劲性能

成本效益与资源优化

将计算密集型工作负载交由 GPU 处理,可降低 CPU 使用率,并最大化现有基础架构的价值。按成本校准后,相较标准 CPU 方案,GPU 加速可使索引吞吐量提升约 5 倍,强制合并速度提升约 6 倍。

增强的实时查询性能

Elastic 的 NVIDIA 加速向量搜索消除了性能瓶颈,使您的基础架构能够以近乎即时的响应时间处理大量查询,从而高效扩展生成式 AI 和 RAG 应用,同时提供实时且相关的见解。

无缝的未来适应性和可扩展性

您将获得一个高性能、经大规模验证的向量数据库,无需持续手动优化。NVIDIA cuVS 可针对不断演进的 NVIDIA GPU 架构和 CUDA 版本优化并加速向量搜索操作,确保 AI 和数据密集型工作负载具备峰值性能与无缝扩展能力。

原生 GPU 加速推理和模型管理

消除管理外部推理提供商和基础设施的复杂性。Elastic Inference Service(EIS)直接在 Elasticsearch 中提供原生、高吞吐的推理能力,并依托现代 NVIDIA AI 基础架构,在大规模场景下依然保持低延迟。原生部署生产就绪的托管模型,包括 Jina AI 的多语言嵌入模型和重排序模型,从而在无需额外运营开销的前提下,实现精准的召回调优并满足数据主权要求。

未来动向

Elastic 与 NVIDIA 携手合作,为依赖向量搜索来构建和交付实时 RAG 与 AI 应用的企业带来更高速度、更强扩展性和更大价值。您的团队能够以更少的基础架构投入、更低的预算压力,轻松应对大规模场景下的高性能需求。

Elasticsearch 已纳入 NVIDIA AI Factory 验证设计,为您提供一套经过验证的全栈预构建蓝图,加速 AI 应用开发,提升效率,缩短落地周期。

NVIDIA cuVS 集成目前已面向 Elastic 自管型企业客户(9.3 版)提供技术预览。预计将于 2026 年 4 月随 9.4 版正式可用,届时将为海量向量搜索和实时上下文检索提供生产就绪的基础。

详细了解不断扩展的 Elastic AI 生态系统,下载《Elastic AI 生态系统开发人员指南》,或在 NVIDIA GTC上与 Elastic 技术专家探讨高性能 AI。欢迎莅临 3200 号展台,观看现场演示并与 Elastic 专家交流。

本文中描述的任何功能或功能性的发布和时间均由 Elastic 自行决定。当前尚未发布的任何功能或功能性可能无法按时提供或根本无法提供。

在本博文中,我们可能使用或提到了第三方生成式 AI 工具,这些工具由其各自所有者拥有和运营。Elastic 对第三方工具没有任何控制权,对其内容、操作或使用不承担任何责任或义务,对您使用此类工具可能造成的任何损失或损害也不承担任何责任或义务。请谨慎使用 AI 工具处理个人、敏感或机密信息。您提交的任何数据都可能用于 AI 训练或其他目的。Elastic 不保证您所提供信息的安全性或保密性。在使用任何生成式 AI 工具之前,您都应自行熟悉其隐私惯例和使用条款。

Elastic、Elasticsearch 及相关标志是 Elasticsearch N.V. 在美国和其他国家/地区的商标、徽标或注册商标。所有其他公司和产品名称均为其相应所有者的商标、徽标或注册商标。