5 raisons pour lesquelles les responsables informatiques ont besoin de la recherche vectorielle pour améliorer les expériences de recherche

illustration-industries-retail-social-1680x980.png

Les fréquentes interactions avec des moteurs de recherche de grande qualité, comme Google et Amazon, ont augmenté les attentes des clients en matière de rapidité et de pertinence des recherches. La recherche vectorielle (également appelée recherche vectorielle sémantique) fait appel au Deep Learning et au Machine Learning afin de déterminer la signification et le contexte des données. Cela peut améliorer les expériences de recherche de votre entreprise et vous offrir une vaste gamme d’avantages, parmi lesquels : 

  • des résultats extrêmement pertinents fournis à vos utilisateurs tout en limitant les efforts ; 
  • le renvoi rapide de résultats de recherche, même lorsque les données sont nombreuses et variées ;
  • l’ajout de nouvelles classes de recherche pour les textes, les images et les sons ;
  • la proposition aux clients de recommandations produits plus précises, de réponses à des FAQ et même d’une personnalisation.

En tant que responsables technologiques, apprenez-en plus sur la recherche vectorielle et la façon dont elle peut vous aider à répondre aux attentes de vos clients, voire à les dépasser. La recherche vectorielle peut transformer vos expériences de recherche et vous aider à atteindre vos objectifs commerciaux.

Qu’est-ce que la recherche vectorielle ?

La recherche vectorielle transforme les textes, les sons et les images en représentations numériques et fait appel au Deep Learning et au Machine Learning pour interpréter la signification, l’intention et le contexte de ces représentations afin de proposer des résultats de recherche bien plus pertinents.

Video thumbnail

La recherche vectorielle sémantique ajoute de nouvelles classes de recherche

Quelle que soit la façon dont nous rédigeons une requête de recherche, nous nous attendons tous à obtenir des résultats extrêmement pertinents. Cependant, même les recherches de mots-clés abstraits requièrent un degré élevé de compréhension de la langue naturelle et un temps de réponse extrêmement rapide. Ajoutons à cela le désir de proposer une gamme plus vaste d’expériences de recherche, par exemple la recherche d’image pour le shopping visuel, la recherche de sons comme Alexa d’Amazon ou les recommandations visuelles dans les applications comme Pinterest. Il devient évident que la recherche doit s’adapter à nos méthodes de recherche.

La technologie de recherche vectorielle sémantique est plus adaptée à la compréhension du langage humain et peut interpréter différents formats de données, comme les données visuelles et sonores ou les textes non structurés. Cette recherche est une sorte de passerelle entre les données non structurées et l’interprétation de l’intention d’un utilisateur (et pas uniquement de ses mots-clés) afin d’offrir une expérience performante qui non seulement répond aux attentes, mais est capable de les dépasser.

La recherche vectorielle comme générateur de véritables revenus 

La recherche vectorielle est déjà largement utilisée pour améliorer la pertinence, booster les ventes et stimuler les revenus.

Comment Spotify tire profit de la recherche vectorielle

Spotify n’a pas toujours utilisé la recherche vectorielle pour les podcasts. Encore récemment, Spotify fonctionnait grâce à la correspondance de mots-clés. Cette méthode de recherche renvoyait tous les résultats contenant les mots-clés de requête dans ses métadonnées indexées. Mais les utilisateurs ne tapent pas toujours exactement ce qu’ils souhaitent. En effet, bien souvent, ils ne savent pas quels mots utiliser et n’ont pas la même façon de s’exprimer.

La recherche vectorielle a permis à Spotify de proposer un contenu plus pertinent avec moins d’efforts, en faisant correspondre des résultats corrélés sémantiquement au lieu de faire appel à des correspondances de mots exactes. Par exemple, une recherche du type « impact voitures électriques climat  » renvoie dorénavant des résultats pour « voitures électriques et écologie » ou « impact environnemental des véhicules électriques ». La recherche vectorielle sémantique permet d’identifier les similarités entre les termes « climat » et « écologie » ou « voiture électrique » et « véhicule électrique » sans que des ingénieurs spécialisés dans la recherche ou des utilisateurs doivent intervenir.  

Comment Home Depot renvoie des résultats de recherche plus pertinents grâce à la recherche vectorielle sémantique

Home Depot dispose d’un inventaire comportant plus de deux millions de produits, parmi lesquels des outils très spécialisés. Les clients peinaient à trouver l’outil adapté à leurs besoins, ce qui entraînait souvent plusieurs essais et de la frustration, ainsi que des retours plus fréquents pour Home Depot. L’implémentation de la recherche vectorielle sémantique a permis à l’entreprise de proposer à ses clients des résultats plus pertinents en combinant recherches vectorielle et textuelle.

Par exemple, lorsqu’un client recherche le mot-clé « matériaux de toit », la recherche renvoie également les bardeaux. Cela a permis à l’équipe de recherche de Home Depot de ne plus avoir à charger des descriptions de produit créatives, des variantes régionales et des mots mal orthographiés dans son index de recherche. 

Apprenez-en plus sur le traitement du langage naturel (NLP), la technologie à l’origine de la recherche vectorielle >> 

La recherche vectorielle peut être implémentée quelle que soit la taille de l’entreprise

La recherche vectorielle peut être utilisée dans de nombreux cas. Quelles que soient la taille de votre entreprise et la quantité de données dont vous disposez, elle peut vous aider à améliorer votre expérience de recherche, à condition d’utiliser l’outil adapté. Voici ce que l’utilisation de la recherche vectorielle peut vous apporter :

Une pertinence améliorée pour susciter davantage d’intérêt

En proposant plus de résultats utiles aux utilisateurs, votre site web et vos applications suscitent davantage d’intérêt. Les recherches basées sur les mots-clés fonctionnent mal lorsque les mots ont plusieurs significations ou sont ambigus. La recherche vectorielle sémantique permet d’obtenir des résultats plus précis, y compris lorsqu’il s’agit de traiter de gros ensembles de données. Cela permet à la technologie de recherche sémantique de renvoyer des résultats pertinents, même lorsque les utilisateurs ne connaissent pas le mot-clé exact. 

Des performances plus rapides, même avec de gros volumes de données

La recherche vectorielle peut être combinée à la recherche traditionnelle pour une meilleure expérience de recherche. Elle renvoie davantage de résultats pertinents plus rapidement, même quand il s’agit de traiter de grands ensembles de données. Les algorithmes comme la recherche des plus proches voisins et la recherche approximative des plus proches voisins utilisent des méthodes efficaces afin de traiter et de classer de gros volumes de documents pour répondre aux requêtes de recherche. 

Des classes de recherche plus nombreuses

Ajoutez de nouveaux types de recherches comme les images ou les sons grâce à un moteur de recherche vectorielle, aussi appelée recherche dans des bases de données vectorielles, recherche sémantique ou recherche cosinus. Par exemple, une entreprise d’e-commerce peut permettre aux visiteurs de son site d’envoyer l’image d’un produit, telle une robe, afin de rechercher les articles similaires. Non seulement cela permet de susciter un intérêt, mais c’est une façon plus simple pour certains clients d’effectuer une recherche.

La recherche vectorielle sémantique interprète le contexte, l’intention et la signification des recherches de façon à ce que vos clients n’aient pas à le faire

La recherche vectorielle sémantique permet d’obtenir une plus grande pertinence en déterminant l’intention, la signification et le contexte d’une requête. Pour cela, la requête est convertie en une représentation numérique signifiante, ou vecteur, qui est comparée à un ensemble de données afin de mesurer la similarité et de trouver les résultats les plus pertinents. Afin de prendre des décisions avisées, les responsables de la technologie ont besoin d’une compréhension technique globale de la recherche vectorielle. Il y a trois éléments à connaître.

Processus technique de fonctionnement d’un moteur de recherche vectorielle

1. Transformation du texte en nombres avec les plongements vectoriels : Tout algorithme a besoin de nombres pour fonctionner. Les vecteurs convertissent les mots-clés textuels en données numériques qui capturent le contenu linguistique du texte. Par exemple, deux modèles couramment utilisés (Word2Vec et BERT) ont été créés en analysant de grands échantillons de données linguistiques afin de comprendre la fréquence des cooccurrences et la relation entre les mots. De ce fait, le vecteur du mot « Canada » peut être proche du mot « France » dans une direction et proche du mot « Toronto » dans une autre. Ces modèles permettent de transformer des mots-clés, des phrases ou des paragraphes en plongements vectoriels pouvant être comparés.

2. Une recherche plus rapide grâce à de meilleurs algorithmes de recherche : Un autre élément essentiel de la recherche vectorielle est un algorithme très performant permettant de comparer et de renvoyer des résultats pertinents rapidement, même lors de la comparaison de milliards de documents. Cela peut inclure la recherche des plus proches voisins (ANN), qui est une forme de recherche de proximité, afin de trouver dans un ensemble donné les résultats les plus proches (en similarité) d’une requête spécifique. L’ANN est efficace, car elle s’adapte à de grands ensembles de données tout en restant performante. Pour améliorer la vitesse des requêtes, un graphe est généré afin de parcourir tous les points de données et de mapper rapidement un vecteur vers les résultats ayant la plus grande similarité.  

3. Découverte des résultats similaires avec les mesures de distance : Les vecteurs permettent d’assigner à chaque mot-clé un ensemble de coordonnées différent qui peut être utilisé pour évaluer la similarité entre une requête et un document en mesurant la proximité à laquelle des termes de recherche apparaissent ensemble. Plus la distance entre les vecteurs est courte, plus grande est la similarité des contenus. Des mesures comme la similarité cosinus sont utilisées pour déterminer la similarité entre deux séries de nombres et de vecteurs afin de renvoyer les résultats les plus proches.

Comment profiter rapidement de tous les avantages des moteurs de recherche vectorielle

Si certaines solutions promettent une expérience de recherche améliorée, Elastic est reconnu comme le leader des technologies de recherche. Nos clients peuvent profiter rapidement des avantages de l’utilisation de la plateforme Elastic et améliorer en permanence leur expérience de recherche grâce des fonctionnalités innovantes, telles que la recherche vectorielle. 

Pourquoi utiliser Elastic pour la recherche vectorielle ?

Chez Elastic, nous proposons un parcours de déploiement simple pour implémenter la recherche vectorielle et les recherches hybrides de façon à améliorer instantanément votre expérience de recherche. En effet, notre recherche vectorielle combine plusieurs approches de pertinence de la recherche, vous garantissant tous les avantages d’Elastic (performances, simplicité et personnalisation) auxquels vient s’ajouter toute la puissance de la recherche vectorielle. 

En optant pour la recherche vectorielle, vous comblerez les plus grandes failles de votre expérience de recherche.

Elastic est plus rapide en matière de performances de requête pour un grand nombre de documents. Pour améliorer la vitesse des requêtes, Elastic utilise un graphe généré afin de parcourir tous les points de données et de mapper rapidement un vecteur vers les résultats ayant la plus grande similarité. Cette approche de la recherche de similarité vectorielle utilise un algorithme ANN (recherche des plus proches voisins) appelé Hierarchical Navigable Small World (HNSW). Pour accélérer les performances des requêtes, une méthodologie HNSW multicouche est prise en charge, ce qui vous permet de parcourir le graphe plus rapidement. Les nouvelles couches améliorent le routage des requêtes, car chaque couche supplémentaire a moins de points de données à parcourir sur une plus longue distance pour trouver le voisin le plus proche. 

Elastic propose une solution facile et intégrée de bout en bout. Comme nous l’avons vu plus tôt, la recherche vectorielle sémantique nécessite la saisie de plongements vectoriels déterminant la similarité. Si la plupart des solutions nécessitent un processus externe pour générer des plongements vectoriels, par exemple pour un texte qui peut être un réseau de neurones profond, ce n’est pas le cas d’Elastic. La recherche vectorielle d’Elastic a pour avantage de permettre la création en toute simplicité d’une prise en charge des plongements vectoriels.

Cela se fait par le biais du type de champ vectoriel dense, qui stocke des vecteurs denses sous forme de valeurs float et peut être utilisé pour trouver rapidement des résultats similaires avec l’API kNN search d’Elastic. Cela simplifie l’implémentation et vous permet de générer des vecteurs plus facilement. Les équipes en voient immédiatement les bénéfices. Vous pouvez en outre compter sur Elastic pour distribuer, calculer et scaler les données sous forme de vecteurs afin d’améliorer les performances et de réduire les coûts. 

Elastic travaille pour vous. Personnalisez nos solutions selon vos besoins.. Elastic prend en charge PyTorch, qui vous permet de déployer votre propre modèle selon vos envies. Vous pouvez le personnaliser en fonction de vos besoins ou de votre secteur afin d’avoir un avantage sur la concurrence. Elastic propose également des modèles prêts à l’emploi pour une solution de démarrage rapide via HuggingFace qui profite d’une communauté croissante de modèles de langage reconnus. 

Une meilleure recherche profite à votre entreprise

Avec l’augmentation de la demande client, il est indispensable de proposer une expérience de recherche de bonne qualité. Heureusement, la recherche vectorielle sémantique est une technologie évolutive qui promet une expérience de recherche exceptionnelle. Que vous soyez en quête de nouveaux types de recherche, de résultats plus rapides, d’une plus grande pertinence des résultats ou de personnalisation, Elastic peut vous aider à atteindre vos objectifs. Pour poursuivre votre découverte, apprenez comment avoir un réel impact avec la recherche vectorielle sur notre blog technique.