Glossary

This glossary describes essential terms and concepts to help you understand Elasticsearch and its related technologies.

WordPiece

A subword tokenization method similar to BPE, used primarily in BERT-based models. It selects merges based on the likelihood of the training data rather than simple frequency. Subword pieces that continue a previous token are prefixed with ## (e.g., "embed" + "##dings").

Prêt à créer des expériences de recherche d'exception ?

Une recherche suffisamment avancée ne se fait pas avec les efforts d'une seule personne. Elasticsearch est alimenté par des data scientists, des ML ops, des ingénieurs et bien d'autres qui sont tout aussi passionnés par la recherche que vous. Mettons-nous en relation et travaillons ensemble pour construire l'expérience de recherche magique qui vous permettra d'obtenir les résultats que vous souhaitez.

Jugez-en par vous-même