Introduction aux emboîtements

Dans le domaine de l'apprentissage automatique, un encastrement est un vecteur (un tableau de nombres) qui représente des objets du monde réel tels que des mots, des phrases, des images ou des vidéos. La propriété intéressante de ces encastrements est que deux encastrements représentant des entités du monde réel similaires ou apparentées partageront également certaines similitudes, de sorte que les encastrements peuvent être comparés et qu'une distance entre eux peut être calculée.

Si l'on pense spécifiquement à une application de recherche, la recherche d'encastrements dans l'espace vectoriel tend à trouver des résultats qui sont davantage liés à des concepts qu'aux mots-clés exacts tapés dans l'invite de recherche.

Dans cette section du tutoriel, vous allez apprendre à générer des embeddings à l'aide de modèles d'apprentissage automatique librement disponibles, puis vous utiliserez le support de la base de données vectorielle d'Elasticsearch pour stocker et rechercher ces embeddings. Enfin, vous combinerez également les résultats de la recherche vectorielle et de la recherche en texte intégral pour créer une solution de recherche hybride puissante qui offre le meilleur des deux approches.

Prêt à créer des expériences de recherche d'exception ?

Une recherche suffisamment avancée ne se fait pas avec les efforts d'une seule personne. Elasticsearch est alimenté par des data scientists, des ML ops, des ingénieurs et bien d'autres qui sont tout aussi passionnés par la recherche que vous. Mettons-nous en relation et travaillons ensemble pour construire l'expérience de recherche magique qui vous permettra d'obtenir les résultats que vous souhaitez.

Jugez-en par vous-même