Qu'est-ce que la recherche sémantique ?

Déterminez quel type de mise en œuvre vous convient le mieux : une mise en œuvre prête à l'emploi ou une mise en œuvre personnalisée ?

Définition de la recherche sémantique

La recherche sémantique est une technologie de moteur de recherche qui interprète le sens des mots et des phrases. Elle renvoie des contenus qui correspondent au sens d'une requête, et non pas des contenus qui collent littéralement aux mots d'une requête.

La recherche sémantique regroupe les capacités d'un moteur de recherche, parmi lesquelles la compréhension des mots par rapport à l'intention de l'utilisateur et au contexte de la recherche.

Ce type de recherche vise à améliorer la qualité des résultats renvoyés grâce à une interprétation plus précise et en contexte du langage naturel. Pour y parvenir, la recherche sémantique fait correspondre l'intention de la recherche et le sens sémantique en s'appuyant sur des technologies telles que le Machine Learning et l'intelligence artificielle.

Comment la recherche sémantique fonctionne-t-elle ?

La recherche sémantique est adossée à la recherche vectorielle, qui lui permet de fournir et de classer les contenus en fonction de la pertinence contextuelle et de la pertinence de l'intention. La recherche vectorielle encode les détails des informations recherchables dans les champs de termes ou articles associés, qu'on appelle vecteurs, puis compare ces vecteurs pour déterminer ceux qui présentent la plus grande similarité.

Une recherche sémantique adossée à une recherche vectorielle produit des résultats en travaillant simultanément des deux côtés du pipeline de la requête. Au moment où une requête est lancée, le moteur de recherche transforme celle-ci en plongements, qui sont des représentations numériques des données et du contexte associé. Ces représentations sont stockées sous forme de vecteurs. L'algorithme kNN, c'est-à-dire l'algorithme des k plus proches voisins, fait alors correspondre les vecteurs des documents existants aux vecteurs de la requête (à noter : une recherche sémantique concerne du texte). La recherche sémantique génère ensuite des résultats et les classe en fonction de leur pertinence conceptuelle.

  1. Au moment où une requête est lancée, le moteur de recherche transforme celle-ci en plongements, qui sont des représentations numériques des données et du contexte associé. Ces représentations sont stockées sous forme de vecteurs.
  2. L'algorithme kNN, c'est-à-dire l'algorithme des k plus proches voisins, fait alors correspondre les vecteurs des documents existants aux vecteurs de la requête (à noter : une recherche sémantique concerne du texte).
  3. La recherche sémantique génère ensuite des résultats et les classe en fonction de leur pertinence conceptuelle.

Contexte
Dans le cadre d'une recherche sémantique, le contexte peut faire référence à toute information supplémentaire, comme la localisation géographique de la personne qui fait la recherche, le contexte textuel des mots employés dans la requête, ou encore le contexte de l'historique de recherche de l'utilisateur.

La recherche s'appuie sur les indications contextuelles pour déterminer le sens d'un mot dans un ensemble comptant des millions d'exemples. La recherche sémantique identifie également les autres mots qui peuvent être utilisés dans des contextes similaires.

Par exemple, une recherche sur le terme "football" signifierait "soccer" aux États-Unis et "football" au Royaume-Uni et dans d'autres régions du monde. La recherche sémantique ferait donc une distinction dans les résultats selon la localisation géographique de l'utilisateur.

Intention de l'utilisateur
Le rôle de la recherche sémantique est d'améliorer l'expérience de l'utilisateur. Pour fournir les résultats les plus pertinents, elle interprète l'intention de l'utilisateur pour comprendre ses besoins. Veut-il obtenir des informations ? Cherche-t-il à faire un achat ? Selon la requête et le contexte dans lequel elle s'inscrit, la recherche sémantique va classer les résultats par ordre de pertinence.

La recherche sémantique peut être également modifiée ou optimisée à l'aide d'un paramétrage de catégorisation des requêtes, pour afficher par exemple les produits les mieux notés en premier jusqu'aux produits les moins bien notés.

Personnaliser les expériences de recherche de vos utilisateurs

Diagram showing the steps of generative AI including vector representation and transforming into embedding

Recherche sémantique et recherche par mots-clés

La différence entre la recherche sémantique et la recherche par mots-clés est la suivante : la recherche par mots-clés renvoie des résultats qui correspondent aux termes exacts, à des synonymes ou à des mots similaires, tandis que la recherche sémantique s'intéresse au sens des mots de la requête. Dans certains cas, la recherche sémantique peut générer des résultats qui n'auront pas de correspondance directe avec les mots employés, mais qui se conformeront à l'intention de l'utilisateur.

Les moteurs de recherche par mots-clés utilisent des outils d'expansion ou de relaxation des requêtes, comme les synonymes ou les omissions de mots. Ils utilisent également des outils de traitement du langage naturel et de compréhension, comme la tolérance aux fautes d'orthographe, la conversion en tokens et la normalisation. En revanche, la recherche sémantique peut renvoyer des résultats de requête qui correspondent au sens avec l'utilisation de la recherche vectorielle.

Prenons l'exemple de "lait au chocolat". Un moteur de recherche sémantique fera la distinction entre un "lait au chocolat" et du "chocolat au lait". Même si les mots-clés de la requête sont identiques, l'ordre dans lequel ils sont indiqués a une incidence sur le sens. En tant qu'humains, nous comprenons que "chocolat au lait" fait référence à un type de chocolat, tandis que "lait au chocolat" est une boisson lactée goût chocolat.

En quoi la recherche sémantique est-elle importante ?

La recherche sémantique est importante car elle offre une surface de recherche plus vaste. Étant donné qu'elle est adossée à la recherche vectorielle, elle permet une expérience de recherche plus intuitive, dans laquelle le contexte et l'intention sont essentiels pour générer des résultats.

Étant donné que les algorithmes de recherche sémantique continuent à "apprendre" à l'aide de nombreux indicateurs clés de performance (KPI), comme les taux de conversion et les taux de rebond, la recherche sémantique contribue à booster la satisfaction des utilisateurs.

La recherche sémantique avec Elasticsearch

La plateforme Elasticsearch est équipée de solutions de Machine Learning et d'IA, dont un modèle de recherche sémantique : Elastic Learned Sparse EncodeR, ou ELSER. Ce modèle NLP est entraîné par Elastic afin de proposer la recherche sémantique dans un outil facile à déployer.

Elasticsearch stocke vos données en toute sécurité pour une recherche rapide, une pertinence sur mesure et des analyses puissantes qui s'adaptent efficacement. Elasticsearch est le composant principal de la Suite Elastic, un ensemble d'outils gratuits et ouverts d'ingestion, d'enrichissement, de stockage, d'analyse et de visualisation de données.

En savoir plus sur Elasticsearch