可用于生产的十亿级向量数据库 — Elasticsearch

了解使 Elasticsearch 和 Lucene 成为向量数据库首选的最新创新技术。
阅读博文学习如何将 Elasticsearch 用作嵌入的向量数据库,支持搜索,并构建检索增强生成 (RAG)、摘要和问答等用例。
在 Search Labs 上了解更多信息Elastic 率先提供更好的二进制量化 (BBQ),这是一种针对向量数据库的优化方法,可实现更快、更准确的向量搜索,并减少 95% 的内存。
深入了解 BBQPUT _inference/text_embedding/my-e5-endpoint
{
"service": "elasticsearch",
"service_settings": {
"num_allocations": 1,
"num_threads": 1,
"model_id": ".multilingual-e5-small"
}
}
向量数据库超集
根据您想要打造的向量搜索体验来选择向量数据库。
部分向量数据库
Elasticsearch
存储嵌入
全面支持
全面支持(免费)
生成嵌入
部分支持
全面支持(付费)
搜索嵌入
全面支持
全面支持(免费)
搜索 BM25
部分支持
全面支持(免费)
混合搜索(BM25 + 向量)
全面支持
全面支持(免费)
筛选、分面搜索、聚合
全面支持
全面支持(免费)
搜索自动完成
不支持
全面支持(免费)
针对多种数据类型(文本、向量、地理位置)进行优化
部分支持
全面支持(免费)
为多种嵌入模型提供支持
全面支持
全面支持(付费)
内置的语义搜索模型
不支持
全面支持(付费)
数据推理管道
部分支持
全面支持(付费)
采集工具(网络爬虫*、连接器*、API 框架、Beats、Fleet、代理)
部分支持
全面支持(*付费)
文档和字段级安全性
不支持
全面支持(付费)
Elasticsearch — 实际应用
了解企业如何构建人工智能搜索应用程序,以改善客户体验并帮助用户准确找到所需的内容。
客户聚焦
Reed 是英国最大的招聘机构,它利用 Elasticsearch 中的向量嵌入将求职者和雇主联系起来。
客户聚焦
Stack Overflow 将人类专家的智慧与生成式人工智能相结合,加快了从开发人员知识 库中检索可靠信息的速度。
客户聚焦
Adobe 可以扩展、管理多种用例,并将机器学习功能与 Elastic 结合使用。
开始实现向量 搜索
博客
网络研讨会
演示项目
常见问题
向量数据库将信息存储为向量,向量是数据对象的数字表示,也称为向量嵌入。它利用向量嵌入技术,在海量结构化、非结构化和半结构化数据(如图像、文本、视频和音频)中进行多模态搜索。向量数据库专为管理向量嵌入而构建,因此可为数据管理提供完整的解决方案。
向量嵌入利用机器学习模型将文本转化为数字,让您可以执行向量搜索。通过将数据转换为向量,嵌入可以更容易地比较、搜索和分析空间中项目之间的相似性。
向量数据库可实现本地部署和云环境之间的无缝数据迁移,并为向量嵌入提供存储空间,从而提供大规模搜索的效率。向量数据库擅长相似性搜索,可以让您轻松找到相关项目,这对于推荐系统、图像搜索和内容发现至关重要。借助语义搜索功能,它们不只停留在关键词的简单匹配上,而是能够根据词语的意义和上下文环境来提供搜索结果。通过存储向量嵌入,它们可以支持人工智能和机器学习应用程序,从而更容易部署 NLP 和推荐模型。
是的,Elasticsearch 是世界上部署最广泛的开源向量数据库,为您提供大规模、高效地创建、存储和搜索向量嵌入的有效方法。借助 Elastic 的企业级向量数据库,即使数据快速变化,您也可以实现快速查询时间和最佳性能。它可根据扩展进行构建,在简化开发流程的同时提供相关的个性化搜索结果。