Recherche hybride simplifiée — Une API unique. Une pertinence exceptionnelle.

Elasticsearch vous offre tous les outils nécessaires pour ajouter une recherche hybride via une API unique, afin que vous puissiez rapidement améliorer les résultats et optimiser la pertinence sans avoir à assembler plusieurs systèmes.

Les capacités du noyau de la recherche hybride

La recherche hybride est une technique de recherche d'informations qui améliore la pertinence en combinant deux ou plusieurs méthodes de recherche en une seule liste classée.

  • Recherche lexicale

    La recherche lexicale repose sur des mots-clés spécifiques. Elle est idéale pour les faits précis, les termes rares et le contenu structuré.

  • Recherche vectorielle

    La recherche vectorielle est basée sur la signification sémantique. Elle est idéale pour les contenus non structurés et la recherche basée sur le sens.

  • Recherche hybride

    La recherche hybride combine plusieurs méthodes de recherche, telles que la recherche lexicale, sémantique, géographique et autres, afin d'obtenir une pertinence supérieure, idéale pour les cas d'utilisation du monde réel.

Recherche hybride avec Elasticsearch

Rechercher tous les types de données dans un seul datastore, et soutenir Retrieval-Augmented Generation (RAG) et les agents d'IA avec des résultats qui équilibrent la précision (avec des algorithmes de notation tels que BM25F) et la compréhension sémantique.

  • Démarrez rapidement grâce à la recherche hybride

    Créez facilement des recherches hybrides à la vitesse d'une API unique en combinant l'extraction lexicale et sémantique. Équilibrez les correspondances exactes avec la signification contextuelle et obtenez une pertinence de haute qualité sans complexité supplémentaire.

  • Personnalisez la pertinence avec un contrôle total.

    Combinez la recherche lexicale avec des modèles prêts à la production pour la recherche sémantique tels que ELSER, jina-embeddings-v3, ou les vôtres pour construire des pipelines hybrides de récupération. Ensuite, affinez la pertinence en expérimentant des techniques avancées telles que les filtres, les boosts, le classement et le reclassement.

  • Créez une recherche hybride qui couvre le texte, les images et les données géospatiales

    Avec Elasticsearch, la recherche hybride s’adapte à la combinaison dont vous avez besoin. Combinez les approches par mot-clé, sémantique, géospatial et multimodal, et obtenez des résultats aussi précis que pertinents.

  • Améliorez la fiabilité des agents IA avec un contexte pertinent.

    Utilisez la recherche hybride pour concevoir un contexte de haute qualité à travers vos données, fournissant ainsi aux agents d'IA les informations dont ils ont besoin pour raisonner, planifier, agir et construire des workflows plus précis et plus fiables.

Pourquoi les développeurs choisissent Elasticsearch

Procurez-vous les meilleurs outils pour la précision, l'explicabilité et la maîtrise. La recherche lexicale est performante pour les requêtes structurées, les termes inhabituels et les données externes. La recherche sémantique ajoute une dimension floue et de la récupération lorsque les correspondances exactes ne sont pas optimales. Contrôlez leur synergie en paramétrant la notation, les filtres et les boosts.

Recherche lexicale
Pour des requêtes exactes, structurées et explicables
Recherche vectorielle
Pour une rechercher flexible, sémantique et à rappel élevé
Recherche hybride
Pour une pertinence de niveau production issue des deux approches
Notation qui a du sens

Utilisez la notation BM25F avec un contrôle total sur la pondération des champs et l’amplification des termes — aucun modèle n’est requis.

Récupérez des résultats sémantiquement liés via les champs dense_vector ou semantic_text.

Combinez les résultats via reciprocal_rank_fusion ou <options> dans l'API rank.

Contrôle total de votre requête DSL

Optimisez la pertinence en utilisant les combined_fields, le boost, le flou (fuzziness), les synonymes et les analyseurs.

Apportez vos propres embeddings ou utilisez l’inférence intégrée avec ELSER, OpenAI, etc.

Utilisez une requête hybride unique avec filtres partagés, poids et logique de reclassement.

Des filtres qui fonctionnent tout simplement

Bénéficiez d'une prise en charge native des filtres geo, term, range et ACL — rapide et stable à grande échelle.

ACORN-1 permet un kNN filtré rapide même sur de grands ensembles de données avec prise en charge de la clause de filtre .

Le niveau de filtrage partagé opère sur les deux récupérateurs — aucun assemblage de pipeline n'est requis.
Capacités de débogage et d'inspection

Utilisez explain, profile et le champ _rank_features pour comprendre comment les documents obtiennent leur score.

Les scores vectoriels sont pleinement visibles — vous avez la possibilité d’examiner les calculs de similarité ou les contributions de pondération.
Gagnez en visibilité pour le débogage de bout en bout sur les deux parcours de recherche, y compris l'influence de chaque reclasseur.
Idéal lorsque...
Vous avez besoin de précision, de filtrage et de contrôle — pour les logs, le catalogue, les identifiants et la conformité.
Vous gérez des requêtes vagues, de nouveaux termes, des dérives sémantiques ou des formulations inconnues.
Vous voulez des résultats robustes, ajustables et explicables — même lorsque les requêtes deviennent inhabituelles.
Notation qui a du sens
Contrôle total de votre requête DSL
Des filtres qui fonctionnent tout simplement
Capacités de débogage et d'inspection
Idéal lorsque...
Recherche lexicale
Pour des requêtes exactes, structurées et explicables
Recherche vectorielle
Pour une rechercher flexible, sémantique et à rappel élevé
Recherche hybride
Pour une pertinence de niveau production issue des deux approches

Utilisez la notation BM25F avec un contrôle total sur la pondération des champs et l’amplification des termes — aucun modèle n’est requis.

Récupérez des résultats sémantiquement liés via les champs dense_vector ou semantic_text.

Combinez les résultats via reciprocal_rank_fusion ou <options> dans l'API rank.

Optimisez la pertinence en utilisant les combined_fields, le boost, le flou (fuzziness), les synonymes et les analyseurs.

Apportez vos propres embeddings ou utilisez l’inférence intégrée avec ELSER, OpenAI, etc.

Utilisez une requête hybride unique avec filtres partagés, poids et logique de reclassement.

Bénéficiez d'une prise en charge native des filtres geo, term, range et ACL — rapide et stable à grande échelle.

ACORN-1 permet un kNN filtré rapide même sur de grands ensembles de données avec prise en charge de la clause de filtre .

Le niveau de filtrage partagé opère sur les deux récupérateurs — aucun assemblage de pipeline n'est requis.

Utilisez explain, profile et le champ _rank_features pour comprendre comment les documents obtiennent leur score.

Les scores vectoriels sont pleinement visibles — vous avez la possibilité d’examiner les calculs de similarité ou les contributions de pondération.
Gagnez en visibilité pour le débogage de bout en bout sur les deux parcours de recherche, y compris l'influence de chaque reclasseur.
Vous avez besoin de précision, de filtrage et de contrôle — pour les logs, le catalogue, les identifiants et la conformité.
Vous gérez des requêtes vagues, de nouveaux termes, des dérives sémantiques ou des formulations inconnues.
Vous voulez des résultats robustes, ajustables et explicables — même lorsque les requêtes deviennent inhabituelles.

Ajustez votre parcours de pertinence

Avec Elasticsearch, vous maîtrisez la pertinence à tous les niveaux, de l’absence de configuration à la personnalisation totale. Explorez l’intégralité du parcours de réglage sur Elasticsearch Labs.

  • Commencez par rechercher lexicalement

    Utilisez BM25F : la technologie originale sans LLM.

  • Ajoutez la recherche hybride

    Utilisez des modèles performants disponibles d'emblée, tels qu'ELSER et jina-embeddings-v3, avec la recherche lexicale pour un meilleur rappel sur les requêtes complexes.

  • Mode expert

    Utilisez des reclasseurs, des récupérateurs et une meilleure quantification binaire (BBQ) pour transférer des pipelines de récupération spécifiques au domaine.

Le meilleur de sa catégorie ? Intégré

Commencez par les modèles d'IA ELSER et Jina AI, développés par Elastic et intégrés à Elasticsearch. Ou connectez-vous aux modèles que vous utilisez déjà grâce à des intégrations natives dans l'écosystème de l'IA.

A four-column ecosystem diagram displaying the logos of leading AI and machine learning partners across Model Providers, Platform Providers, MLOps and orchestration tools, and Open Standard API clients. The visual shows Elastic connecting natively to the full AI stack to enhance search and power intelligent applications.

Questions fréquentes

Qu’est-ce que la recherche hybride ?

Recherche hybride allie la précision des mots-clés (lexicale) à la similarité des vecteurs (sémantique), permettant ainsi aux utilisateurs d’obtenir des résultats pertinents même lorsque les requêtes ne correspondent pas exactement au texte.