Busca híbrida simplificada — Uma API. Relevância excepcional.

O Elasticsearch oferece todas as ferramentas para adicionar buscar híbrida por meio de uma única API, para que você possa melhorar os resultados e ajustar para uma relevância excepcional sem precisar integrar múltiplos sistemas.

As principais funcionalidades da busca híbrida

A busca híbrida é uma técnica de recuperação de informação que melhora a relevância ao combinar dois ou mais métodos de busca em uma única lista classificada.

  • Busca lexical

    A busca lexical baseia-se em palavras-chave específicas. É ideal para fatos específicos, termos raros e conteúdo estruturado.

  • Busca vetorial

    A busca vetorial baseia-se no significado semântico. É ideal para conteúdo não estruturado e recuperação baseada em significado.

  • Busca híbrida

    A busca híbrida combina múltiplos métodos de recuperação, como lexical, semântica, geográfica e outros, para alcançar uma relevância superior, ideal para casos de uso no mundo real.

Busca híbrida com o Elasticsearch

Busque todos os tipos de dados em um único repositório e potencialize a retrieval-augmented generation (RAG) e agentes de IA com resultados que equilibram precisão (com algoritmos de pontuação como BM25F) e compreensão semântica.

  • Comece a usar a busca híbrida

    Construa buscas híbridas com a velocidade de uma única API, combinando recuperação lexical e semântica. Equilibre correspondências exatas com significado contextual e alcance alta relevância sem complexidade adicional.

  • Personalize a relevância com controle total

    Combine a busca lexical com modelos de busca semântica prontos para produção, como ELSER, jina-embeddings-v3 ou modelos próprios, para construir fluxos de recuperação híbridos. Em seguida, refine a relevância experimentando técnicas avançadas como filtros, boosts, ranqueamento e reranqueamento.

  • Crie uma busca híbrida que abrange texto, imagem e dados geoespaciais

    Com o Elasticsearch, a busca híbrida se adapta a qualquer combinação que você precisar. Combine abordagens por palavra-chave, semântica, geoespacial e multimodal para entregar resultados tão precisos quanto relevantes.

  • Melhore a confiabilidade do agente de IA com contexto relevante

    Utilize a busca híbrida para criar contexto de alta qualidade em seus dados, fornecendo aos agentes de IA as informações necessárias para raciocinar, planejar, agir e construir fluxos de trabalho mais precisos e confiáveis.

Por que os desenvolvedores escolhem o Elasticsearch

Tenha as melhores ferramentas para precisão, explicabilidade e controle. A busca lexical se destaca em consultas estruturadas, termos raros e dados fora do domínio. A busca semântica adiciona flexibilidade e abrangência quando as correspondências exatas não são suficientes. Controle a forma como elas trabalham juntas ajustando a pontuação, os filtros e os reforços.

Busca lexical
Para consultas exatas, estruturadas e explicáveis
Busca vetorial
Para uma busca flexível, semântica e de alta recuperação
Busca híbrida
Para uma relevância de nível de produção de ambos os mundos
Pontuação que faz sentido

Use a pontuação BM25F com controle total sobre os pesos do campo e os aumentos de termo, não é necessário um modelo.

Recupere resultados semanticamente relacionados por meio de campos dense_vector ou semantic_text.

Combine os resultados através de reciprocal_rank_fusion ou <options> na API de classificação .

Controle total na sua DSL de consulta.

Ajuste a relevância usando combined_fields, boost, fuzziness, synonyms e analyzers.

Traga seus próprios embeddings ou use inferência integrada com ELSER, OpenAI, etc.

Use uma única consulta híbrida com filtros, pesos e lógica de reclassificação compartilhados.

Filtros que simplesmente funcionam

Tenha suporte nativo para filtros geográficos, de termo, de intervalo e ACL, rápido e estável em grande escala.

O ACORN-1 permite kNN filtrado rápido mesmo em grandes conjuntos de dados com suporte a cláusulas de filtro.

A camada de filtragem compartilhada funciona entre ambos os recuperadores, sem necessidade de integração de pipeline.
Recursos para fazer debug e inspeção

Use explain, profile e o campo _rank_features para entender como os documentos são avaliados.

As pontuações de vetor são totalmente expostas, inspeciona a matemática de similaridade ou as contribuições de peso.
Tenha visibilidade de ponta a ponta para fazer debug em ambos os caminhos de busca, até o impacto de cada reclassificador.
Bom para quando...
Você precisa de precisão, filtragem e controle para logs, catálogos, identificadores e conformidade.
Você está lidando com consultas vagas, novos termos, deriva semântica ou frases desconhecidas.
Você quer resultados robustos, ajustáveis e explicáveis, mesmo quando as consultas ficam estranhas.
Pontuação que faz sentido
Controle total na sua DSL de consulta.
Filtros que simplesmente funcionam
Recursos para fazer debug e inspeção
Bom para quando...
Busca lexical
Para consultas exatas, estruturadas e explicáveis
Busca vetorial
Para uma busca flexível, semântica e de alta recuperação
Busca híbrida
Para uma relevância de nível de produção de ambos os mundos

Use a pontuação BM25F com controle total sobre os pesos do campo e os aumentos de termo, não é necessário um modelo.

Recupere resultados semanticamente relacionados por meio de campos dense_vector ou semantic_text.

Combine os resultados através de reciprocal_rank_fusion ou <options> na API de classificação .

Ajuste a relevância usando combined_fields, boost, fuzziness, synonyms e analyzers.

Traga seus próprios embeddings ou use inferência integrada com ELSER, OpenAI, etc.

Use uma única consulta híbrida com filtros, pesos e lógica de reclassificação compartilhados.

Tenha suporte nativo para filtros geográficos, de termo, de intervalo e ACL, rápido e estável em grande escala.

O ACORN-1 permite kNN filtrado rápido mesmo em grandes conjuntos de dados com suporte a cláusulas de filtro.

A camada de filtragem compartilhada funciona entre ambos os recuperadores, sem necessidade de integração de pipeline.

Use explain, profile e o campo _rank_features para entender como os documentos são avaliados.

As pontuações de vetor são totalmente expostas, inspeciona a matemática de similaridade ou as contribuições de peso.
Tenha visibilidade de ponta a ponta para fazer debug em ambos os caminhos de busca, até o impacto de cada reclassificador.
Você precisa de precisão, filtragem e controle para logs, catálogos, identificadores e conformidade.
Você está lidando com consultas vagas, novos termos, deriva semântica ou frases desconhecidas.
Você quer resultados robustos, ajustáveis e explicáveis, mesmo quando as consultas ficam estranhas.

Dimensione sua jornada de relevância

O Elasticsearch oferece controle de relevância em todos os níveis, desde zero-configuração até personalização total. Explore a jornada completa de ajuste no Elasticsearch Labs.

  • Comece com uma busca lexical

    Use o BM25F: a tecnologia original que não precisa de LLM.

  • Adicione busca híbrida

    Use modelos de alto desempenho disponíveis de fábrica, como ELSER e jina-embeddings-v3, com busca lexical para melhor recordação em consultas complexas.

  • Modo especialista

    Use reclassificadores, recuperadores e Better Binary Quantization (BBQ) para enviar pipelines de recuperação específicos de domínio.

O melhor da categoria? Integrado diretamente

Comece com os modelos ELSER e Jina AI da Elastic, integrados ao Elasticsearch. Ou conecte-se aos modelos que você já usa por meio de integrações nativas em todo o ecossistema de IA.

A four-column ecosystem diagram displaying the logos of leading AI and machine learning partners across Model Providers, Platform Providers, MLOps and orchestration tools, and Open Standard API clients. The visual shows Elastic connecting natively to the full AI stack to enhance search and power intelligent applications.

Perguntas frequentes

O que é busca híbrida?

A busca híbrida combina a precisão das palavras-chave (lexical) com a similaridade vetorial (semântica), permitindo que os usuários tenham resultados relevantes mesmo quando as consultas não correspondem exatamente ao texto.