Elasticsearch 是 NVIDIA Enterprise AI Factory 验证设计中推荐的向量数据库

pawel-czerwinski-dlVvDJmqf-Q-unsplash.jpg

Elastic 现已与 NVIDIA Enterprise AI Factory 验证设计集成,为用户提供推荐的向量数据库,用于本地 AI 工厂。该验证设计为企业提供了一个框架,用于在本地构建和部署 AI 工厂。

用于多模态检索增强生成 (RAG) 用例的 Elasticsearch 向量数据库参考设计
Elasticsearch 向量数据库用于多模态检索增强生成 (RAG) 用例

Elasticsearch:为 NVIDIA AI Factory 提供企业级向量数据库

经过验证的设计将 NVIDIA 加速计算和 AI 软件与 Elasticsearch 相结合,用于优化 AI 模型部署、多模态数据提取和嵌入生成,Elasticsearch 是一种经过大规模验证的矢量数据库,用于存储和搜索所有 AI 数据。客户可以在 NVIDIA AI Factories 中使用经过验证的设计来进行智能体式 AI 应用程序的开发。

NVIDIA Enterprise AI Factory 验证设计 与 Elasticsearch 相结合,帮助企业通过提供完整的预先工程化蓝图来加速 AI 应用。

但合作的意义远不止于此——想想 GPU 加速的向量搜索!

未来动向

Elastic 将使用开源 GPU 加速向量搜索库 NVIDIA cuVS 创建一个新的 Elasticsearch 插件,在两个关键领域引入 GPU 加速功能:

  1. 索引构建时间:通过使用 NVIDIA GPU,您可以减少在 Elasticsearch 中构建和更新向量索引所需的时间。

  2. 查询性能:通过利用 GPU 加速进行 kNN 向量搜索,目标是实现 Elasticsearch 中相似性查询的更低延迟和更高吞吐量,以支持实时 AI 应用。


此次与 NVIDIA 在 GPU 加速方面的合作将建立在 Elastic 团队之前的工作基础上,通过 CPU SIMD、更好的二进制量化 (BBQ) 和更快的过滤 HNSW等技术优化向量搜索功能,使 Elasticsearch 成为用户首选的向量数据库。敬请关注 Elasticsearch Labs 的更多更新

本文中描述的任何功能或功能性的发布和时间均由 Elastic 自行决定。当前尚未发布的任何功能或功能性可能无法按时提供或根本无法提供。

在本博文中,我们可能使用或提到了第三方生成式 AI 工具,这些工具由其各自所有者拥有和运营。Elastic 对第三方工具没有任何控制权,对其内容、操作或使用不承担任何责任或义务,对您使用此类工具可能造成的任何损失或损害也不承担任何责任或义务。请谨慎使用 AI 工具处理个人、敏感或机密信息。您提交的任何数据都可能用于 AI 训练或其他目的。Elastic 不保证您所提供信息的安全性或保密性。在使用任何生成式 AI 工具之前,您都应自行熟悉其隐私惯例和使用条款。 

Elastic、Elasticsearch 及相关标志是 Elasticsearch N.V. 在美国和其他国家/地区的商标、徽标或注册商标。所有其他公司和产品名称均为其相应所有者的商标、徽标或注册商标。