混合搜索,化繁为简 —— 一个 API。非凡的相关性。

Elasticsearch 为您提供了通过单一 API 添加混合搜索所需的所有工具,使您无需拼接多个系统即可快速改进结果并调整以获得卓越的相关性。

混合搜索的核心能力

混合搜索是一种信息检索技术,它通过将两种或更多搜索方法融合到一个单一的排序列表中,来提高相关性。

  • 词法搜索

    词汇搜索基于特定关键词。它非常适合特定事实、罕见术语和结构化内容。

  • 向量搜索

    向量搜索基于语义含义,非常适合非结构化内容和基于含义的检索。

  • 混合搜索

    混合搜索结合了多种检索方法,例如词汇、语义、地理等,以实现卓越的相关性,非常适合现实世界的用例。

使用 Elasticsearch 进行混合搜索

搜索单一数据存储中的各数据类型,并为检索增强生成 (RAG) 和 AI 智能体提供兼顾 BM25F 准确性和语义理解的结果。

  • 立即部署并运行混合搜索

    通过融合词汇和语义检索,借助单一 API 的速度轻松构建混合搜索。在精确匹配与上下文含义之间取得平衡,无需增加复杂性即可获得高质量的相关性。

  • 完全控制,自定义相关性

    将词法搜索与可用于生产环境的语义搜索模型(如 ELSERjina-embeddings-v3 或您自己的模型)相结合,以构建混合检索管道。然后,通过尝试筛选、权重提升、排序和重排序等高级技术来微调相关性。

  • 构建跨文本、图像和地理空间数据的混合搜索

    借助 Elasticsearch,混合搜索可以适应您所需的任何组合。结合关键词、语义、地理空间和多模态方法,交付既精确又高度相关的结果。

  • 利用相关上下文提高 AI 智能体的可靠性

    使用混合搜索在数据中构建高质量的上下文,为 AI 智能体提供所需的信息,使其能够进行推理、规划、采取行动,并构建更准确、更可靠的工作流。

开发者为何选择 Elasticsearch

获取兼顾精准性、可解释性与可控性的最佳工具。词法搜索擅长结构化查询、罕见词项和领域外数据;当精确匹配不足时,语义搜索可提升容错与召回。您可以通过调优评分、设置筛选条件与加权来控制二者如何协同工作。

词汇搜索
针对精确、结构化且可解释的查询
向量搜索
用于灵活、语义化、高召回率的搜索
混合搜索
为了实现两个世界的生产级相关性
合理的评分

使用 BM25F评分 完全控制字段权重和术语提升——无需模型。

通过 dense_vectorsemantic_text 字段检索语义相关的结果。

通过 reciprocal_rank_fusion 或 <options> 在排名 API 中整合结果。

完全掌控您的查询 DSL

使用 combined_fields强调特定结果、模糊匹配同义词和分析器来调整相关性。

自带嵌入或使用 ELSER、OpenAI 等的内置推理。

使用具有共享筛选条件、权重和重排名逻辑的单一混合查询。

行之有效的筛选条件

获得对地理术语范围和 ACL 筛选条件的本地支持,快速、稳定且可扩展。

ACORN-1 即便在支持筛选条件的大型数据集上,也能实现快速筛选型 kNN 搜索。

共享的筛选层可同时作用于两种检索器,无需额外拼接处理流程。
故障排查和检查功能

使用解释配置文件_rank_features 字段来了解文档的得分情况。

向量分数完全公开,检查相似性计算或权重比例。
全面了解两条搜索路径的故障排查情况,直至每个重排序器的影响。
适用于...
您需要针对日志、目录、标识符和合规性的精确性、筛选和控制。
您要处理模糊的查询、新术语、语义转移或未知措辞。
即使查询很奇怪,您也希望获得强大、可调整、可解释的结果。
合理的评分
完全掌控您的查询 DSL
行之有效的筛选条件
故障排查和检查功能
适用于...
词汇搜索
针对精确、结构化且可解释的查询
向量搜索
用于灵活、语义化、高召回率的搜索
混合搜索
为了实现两个世界的生产级相关性

使用 BM25F评分 完全控制字段权重和术语提升——无需模型。

通过 dense_vectorsemantic_text 字段检索语义相关的结果。

通过 reciprocal_rank_fusion 或 <options> 在排名 API 中整合结果。

使用 combined_fields强调特定结果、模糊匹配同义词和分析器来调整相关性。

自带嵌入或使用 ELSER、OpenAI 等的内置推理。

使用具有共享筛选条件、权重和重排名逻辑的单一混合查询。

获得对地理术语范围和 ACL 筛选条件的本地支持,快速、稳定且可扩展。

ACORN-1 即便在支持筛选条件的大型数据集上,也能实现快速筛选型 kNN 搜索。

共享的筛选层可同时作用于两种检索器,无需额外拼接处理流程。

使用解释配置文件_rank_features 字段来了解文档的得分情况。

向量分数完全公开,检查相似性计算或权重比例。
全面了解两条搜索路径的故障排查情况,直至每个重排序器的影响。
您需要针对日志、目录、标识符和合规性的精确性、筛选和控制。
您要处理模糊的查询、新术语、语义转移或未知措辞。
即使查询很奇怪,您也希望获得强大、可调整、可解释的结果。

调优您的相关性之旅

Elasticsearch 让您在各个层面都能掌控相关性——从零配置到完全自定义。在Elasticsearch Labs上探索完整的调优之旅。

  • 从词法搜索开始

    使用 BM25F:独创的无需 LLM 的技术。

  • 添加混合搜索

    使用开箱即用的高性能模型,例如 ELSER 和 jina-embeddings-v3,并结合词汇搜索,以提高复杂查询的召回率。

  • 专家模式

    使用重排器、检索器和更好的二进制量化 (BBQ) 来发送特定域的检索管道。

同类最佳?内置

首先使用 Elasticsearch 内置的 Elastic 自有 ELSER 和 Jina AI 模型。或者,通过跨 AI 生态系统的原生集成,接入您已经在使用的模型。

A four-column ecosystem diagram displaying the logos of leading AI and machine learning partners across Model Providers, Platform Providers, MLOps and orchestration tools, and Open Standard API clients. The visual shows Elastic connecting natively to the full AI stack to enhance search and power intelligent applications.

常见问题

什么是混合搜索?

混合搜索结合了关键词(词汇)精确度和向量(语义)相似度,因此即使查询与文本不完全匹配,用户也能获得相关的结果。