Elasticsearch BBQ vs. OpenSearch FAISS : Comparaison de la recherche vectorielle

De la recherche vectorielle aux API REST puissantes, Elasticsearch met à disposition des développeurs la boîte à outils de recherche la plus complète. Explorez nos notebooks d’exemple dans le dépôt Elasticsearch Labs pour tester de nouvelles approches. Vous pouvez également démarrer un essai gratuit ou exécuter Elasticsearch en local dès aujourd’hui.

Recherche vectorielle avec quantification binaire : Elasticsearch avec BBQ est 5 fois plus rapide qu'OpenSearch avec FAISS. Elastic a reçu des demandes de notre communauté pour clarifier les différences de performance entre Elasticsearch et OpenSearch, en particulier dans le domaine de la recherche sémantique/recherche vectorielle. Nous avons donc réalisé ces tests de performance pour fournir des comparaisons claires et basées sur des données.

Elasticsearch BBQ vs OpenSearch FAISS - Vitesse & débit Comparaison du rappel

Démonstration de quantification binaire

Le stockage de vecteurs à haute dimension dans leur forme originale peut nécessiter beaucoup de mémoire. Les techniques de quantification compriment ces vecteurs dans une représentation compacte, ce qui réduit considérablement l'empreinte mémoire. La recherche s'effectue alors dans l'espace compressé, ce qui réduit la complexité des calculs et accélère les recherches, en particulier dans les grands ensembles de données.

Elastic s'engage à faire de Lucene un moteur vectoriel très performant. Nous avons introduit une meilleure quantification binaire (BBQ) dans Elasticsearch 8.16, en plus de Lucene, et l'avons fait évoluer dans les versions 8.18 et 9.0. BBQ repose sur une nouvelle approche de la quantification scalaire qui réduit les dimensions float32 en bits, ce qui permet une réduction de la mémoire de ~95% tout en conservant une qualité de classement élevée.

OpenSearch, quant à lui, utilise plusieurs moteurs vectoriels : nmslib (aujourd'hui obsolète), Lucene et FAISS. Dans un blog précédent, nous avons comparé Elasticsearch et OpenSearch pour la recherche vectorielle. Nous avons utilisé trois ensembles de données différents et testé différentes combinaisons de moteurs et de configurations sur les deux produits.

Ce blog se concentre sur les algorithmes de quantification binaire actuellement disponibles dans les deux produits. Nous avons testé Elasticsearch avec BBQ et OpenSearch avec la quantification binaire de FAISS en utilisant la piste Rallye openai_vector.

L'objectif principal était d'évaluer la performance des deux solutions avec le même niveau de rappel. Que signifie le terme "rappel"? Le rappel est un indicateur qui mesure le nombre de résultats pertinents retrouvés par un système de recherche.

Dans cette évaluation, recall@k est particulièrement important, k représentant le nombre de premiers résultats pris en compte. Le rappel@10, le rappel@50 et le rappel@100 mesurent donc le nombre de vrais résultats pertinents qui apparaissent respectivement dans les 10, 50 et 100 premiers éléments retrouvés. Le rappel est exprimé sur une échelle de 0 à 1 (ou de 0% à 100% précision). C'est important car nous parlons de KNN approximatif (ANN) et non de KNN exact, où le rappel est toujours de 1 (100%).

Pour chaque valeur de k, nous avons également spécifié n, qui est le nombre de candidats pris en compte avant d'appliquer le classement final. Cela signifie que pour Rappel@10, Rappel@50 et Rappel@100, le système récupère d'abord n candidats à l'aide de l'algorithme de quantification binaire, puis les classe pour déterminer si les k premiers résultats contiennent les éléments pertinents attendus.

En contrôlant n, nous pouvons analyser le compromis entre l'efficacité et la précision. Un n plus élevé augmente généralement le rappel, car plus de candidats sont disponibles pour le classement, mais il augmente également la latence et diminue le débit. Inversement, un n plus faible accélère la recherche mais peut réduire la mémorisation si trop peu de candidats pertinents sont inclus dans l'ensemble initial.

Dans cette comparaison, Elasticsearch a démontré une latence plus faible et un débit plus élevé qu'OpenSearch sur des configurations identiques.

Méthodologie

La configuration complète, ainsi que les scripts Terraform, les manifestes Kubernetes et la piste Rallye spécifique sont disponibles dans ce dépôt sous openai_vector_bq.

Comme pour les benchmarks précédents, nous avons utilisé un cluster Kubernetes composé de :

1 pool de nœuds pour Elasticsearch 9.0 avec 3 machines e2-standard-32 (128GB RAM et 32 CPUs)
1 pool de nœuds pour OpenSearch 2.19 avec 3 machines e2-standard-32 (128GB RAM et 32 CPUs)
1 pool de nœuds pour Rallye avec 2 machines e2-standard-4 (16GB RAM et 4 CPUs)

Configuration de la méthodologie Elasticsearch BBQ vs Opensearch FAISS

Nous avons mis en place un cluster Elasticsearch version 9.0 et un cluster OpenSearch version 2.19.

Elasticsearch et OpenSearch ont été testés avec la même configuration : nous avons utilisé openai_vector Rally track avec quelques modifications - qui utilise 2,5 millions de documents de l'ensemble de données NQ enrichis avec des embeddings générés à l'aide du modèle text-embedding-ada-002 d'OpenAI.

Les résultats portent sur la latence et le débit mesurés à différents niveaux de rappel (rappel@10, rappel@50 et rappel@100) en utilisant 8 clients simultanés pour effectuer des opérations de recherche. Nous avons utilisé un seul arbre et aucune réplique.

Nous avons exécuté les combinaisons suivantes de k-n-rescore, par exemple 10-2000-2000, ou k:10, n:2000 et rescore:2000 permet de retrouver les k (10) premiers candidats sur n candidats (2000) en appliquant un rescore sur 2000 résultats (ce qui équivaut à un "facteur de suréchantillon" de 1). Chaque recherche a été exécutée 10 000 fois avec 1000 recherches comme échauffement :

Rappel@10

10-40-40
10-50-50
10-100-100
10-200-200
10-500-500
10-750-750
10-1000-1000
10-1500-1500
10-2000-2000

Rappel@50

50-150-150
50-200-200
50-250-250
50-500-500
50-750-750
50-1000-1000
50-1200-1200
50-1500-1500
50-2000-2000

Rappel@100

100-200-200
100-250-250
100-300-300
100-500-500
100-750-750
100-1000-1000
100-1200-1200
100-1500-1500
100-2000-2000

Pour reproduire le benchmark, les manifestes Kubernetes pour rally-elasticsearch et rally-opensearch ont toutes les variables pertinentes externalisées dans un ConfigMap, disponible ici (ES) et ici (OS). Le paramètre search_ops peut être personnalisé pour tester n'importe quelle combinaison de k, n et rescore.

Configuration d'OpenSearch Rally

/k8s/rally-openai_vector-os-bq.yml

Configuration de l'index Opensearch

Les variables du ConfigMap sont ensuite utilisées pour la configuration de l'index, certains paramètres restant inchangés. La quantification sur 1 bit dans OpenSearch est configurée en réglant le niveau de compression sur "32x".

index-vectors-only-mapping-with-docid-mapping.json

Configuration d'Elasticsearch Rally

/k8s/rally-openai_vector-es-bq.yml

Configuration de l'index Elasticsearch

index-vectors-only-mapping-with-docid-mapping.json

Résultats

Il y a plusieurs façons d'interpréter les résultats. Pour la latence et le débit, nous avons tracé un graphique simplifié et un graphique détaillé à chaque niveau de rappel. Il est facile de voir les différences si l'on considère que "plus c'est élevé, mieux c'est" pour chaque indicateur. Cependant, le temps de latence est un facteur négatif (plus il est faible, mieux c'est), tandis que le débit est un facteur positif. Pour les graphiques simplifiés, nous avons utilisé (rappel / latence) * 10000 (appelé simplement "vitesse") et rappel * débit, de sorte que les deux mesures signifient qu'une plus grande vitesse et un plus grand débit sont meilleurs. Allons-y.

Rappel @ 10 - simplifié

À ce niveau de rappel, Elasticsearch BBQ est jusqu'à 5 fois plus rapide (3,9 fois plus rapide en moyenne) et a un débit 3,2 fois plus élevé en moyenne qu'OpenSearch FAISS.

Elasticsearch BBQ est jusqu'à 5 fois plus rapide (3,9 fois plus rapide en moyenne) et a un débit 3,2 fois plus élevé en moyenne qu'OpenSearch FAISS pour la vitesse et le débit Rappel@10

Elasticsearch BBQ est jusqu'à 5 fois plus rapide (3,9 fois plus rapide en moyenne) et a un débit 3,2 fois plus élevé en moyenne qu'OpenSearch FAISS.

Rappel @ 10 - Détaillé

Comparaison détaillée du temps de latence recall@10 Elasticsearch BBQ vs Opensearch FAISS

Comparaison détaillée du taux de rappel@10 entre Elasticsearch BBQ et Opensearch FAISS.

	tâche	latence.moyenne	débit.moyen	avg_recall
Elasticsearch-9.0-BBQ	10-100-100	11.70	513.58	0.89
Elasticsearch-9.0-BBQ	10-1000-100	27.33	250.55	0.95
Elasticsearch-9.0-BBQ	10-1500-1500	35.93	197.26	0.95
Elasticsearch-9.0-BBQ	10-200-200	13.33	456.16	0.92
Elasticsearch-9.0-BBQ	10-2000-2000	44.27	161.40	0.95
Elasticsearch-9.0-BBQ	10-40-40	10.97	539.94	0.84
Elasticsearch-9.0-BBQ	10-50-50	11.00	535.73	0.85
Elasticsearch-9.0-BBQ	10-500-500	19.52	341.45	0.93
Elasticsearch-9.0-BBQ	10-750-750	22.94	295.19	0.94
OpenSearch-2.19-faiss	10-100-100	35.59	200.61	0.94
OpenSearch-2.19-faiss	10-1000-1000	156.81	58.30	0.96
OpenSearch-2.19-faiss	10-1500-1500	181.79	42.97	0.96
OpenSearch-2.19-faiss	10-200-200	47.91	155.16	0.95
OpenSearch-2.19-faiss	10-2000-2000	232.14	31.84	0.96
OpenSearch-2.19-faiss	10-40-40	27.55	249.25	0.92
OpenSearch-2.19-faiss	10-50-50	28.78	245.14	0.92
OpenSearch-2.19-faiss	10-500-500	79.44	97.06	0.96
OpenSearch-2.19-faiss	10-750-750	104.19	75.49	0.96

Rappel à 50 ans - simplifié

À ce niveau de rappel, Elasticsearch BBQ est jusqu 'à 5 fois plus rapide (4,2 fois plus rapide en moyenne) et a un débit 3,9 fois plus élevé en moyenne qu'OpenSearch FAISS.

Comparaison des performances vectorielles de Recal @50 Elasticsearch BBQ vs Opensearch FAISS

Elasticsearch BBQ est jusqu'à 5 fois plus rapide (4,2 fois plus rapide en moyenne) et a un débit 3,9 fois plus élevé en moyenne qu'OpenSearch FAISS.

Résultats détaillés - Rappel à 50

Recall@50 Elasticsearch BBQ et Opensearch FAISS résultats de latence

Recall@50 Elasticsearch BBQ et Opensearch FAISS résultats de débit

	Tâche	Latence Moyenne	Débit moyen	Rappel moyen
Elasticsearch-9.0-BBQ	50-1000-1000	25.71	246.44	0.95
Elasticsearch-9.0-BBQ	50-1200-1200	28.81	227.85	0.95
Elasticsearch-9.0-BBQ	50-150-150	13.43	362.90	0.90
Elasticsearch-9.0-BBQ	50-1500-1500	33.38	202.37	0.95
Elasticsearch-9.0-BBQ	50-200-200	12.99	406.30	0.91
Elasticsearch-9.0-BBQ	50-2000-2000	42.63	163.68	0.95
Elasticsearch-9.0-BBQ	50-250-250	14.41	373.21	0.92
Elasticsearch-9.0-BBQ	50-500-500	17.15	341.04	0.93
Elasticsearch-9.0-BBQ	50-750-750	31.25	248.60	0.94
OpenSearch-2.19-faiss	50-1000-1000	125.35	62.53	0.96
OpenSearch-2.19-faiss	50-1200-1200	143.87	54.75	0.96
OpenSearch-2.19-faiss	50-150-150	43.64	130.01	0.89
OpenSearch-2.19-faiss	50-1500-1500	169.45	46.35	0.96
OpenSearch-2.19-faiss	50-200-200	48.05	156.07	0.91
OpenSearch-2.19-faiss	50-2000-2000	216.73	36.38	0.96
OpenSearch-2.19-faiss	50-250-250	53.52	142.44	0.93
OpenSearch-2.19-faiss	50-500-500	78.98	97.82	0.95
OpenSearch-2.19-faiss	50-750-750	103.20	75.86	0.96

Rappel à 100

À ce niveau de rappel, Elasticsearch BBQ est jusqu 'à 5 fois plus rapide (en moyenne 4,6 fois plus rapide) et a un débit 3,9 fois plus élevé en moyenne qu'OpenSearch FAISS.

Rappeler @100 résultats Elasticsearch BBQ VS Opensearch FAISS

Comparaison des performances d'Elasticsearch BBQ et d'Opensearch FAISS en termes de latence et de débit

Résultats détaillés - Rappel à 100

Résultats détaillés de la latence - Rappel @ 100 Elasticsearch BBQ vs Opensearch FAISS

Résultats détaillés du débit - Rappel @ 100 Elasticsearch BBQ vs Opensearch FAISS.

	tâche	latence.moyenne	débit.moyen	avg_recall
Elasticsearch-9.0-BBQ	100-1000-1000	27.82	243.22	0.95
Elasticsearch-9.0-BBQ	100-1200-1200	31.14	224.04	0.95
Elasticsearch-9.0-BBQ	100-1500-1500	35.98	193.99	0.95
Elasticsearch-9.0-BBQ	100-200-200	14.18	403.86	0.88
Elasticsearch-9.0-BBQ	100-2000-2000	45.36	159.88	0.95
Elasticsearch-9.0-BBQ	100-250-250	14.77	433.06	0.90
Elasticsearch-9.0-BBQ	100-300-300	14.61	375.54	0.91
Elasticsearch-9.0-BBQ	100-500-500	18.88	340.37	0.93
Elasticsearch-9.0-BBQ	100-750-750	23.59	285.79	0.94
OpenSearch-2.19-faiss	100-1000-1000	142.90	58.48	0.95
OpenSearch-2.19-faiss	100-1200-1200	153.03	51.04	0.95
OpenSearch-2.19-faiss	100-1500-1500	181.79	43.20	0.96
OpenSearch-2.19-faiss	100-200-200	50.94	131.62	0.83
OpenSearch-2.19-faiss	100-2000-2000	232.53	33.67	0.96
OpenSearch-2.19-faiss	100-250-250	57.08	131.23	0.87
OpenSearch-2.19-faiss	100-300-300	62.76	120.10	0.89
OpenSearch-2.19-faiss	100-500-500	84.36	91.54	0.93
OpenSearch-2.19-faiss	100-750-750	111.33	69.95	0.94

Améliorations apportées au barbecue

BBQ a beaucoup évolué depuis sa première version. Pour Elasticsearch 8.16, à des fins de comparaison, nous avons inclus un benchmark de la version 8.16 avec le benchmark actuel, et nous pouvons voir comment le rappel et la latence se sont améliorés depuis.

Améliorations de la latence et du rappel d'Elasticsearch 9.0 BBQ comparées à Elasticsearch 8.16 BBQ

Dans Elasticsearch 8.18 et 9.0, nous avons réécrit l'algorithme de base pour quantifier les vecteurs. Ainsi, si BBQ 8.16 était bien, les versions les plus récentes sont encore meilleures. Pour en savoir plus, cliquez ici et ici. En bref, chaque vecteur est quantifié individuellement au moyen de quantiles scalaires optimisés. Ainsi, les utilisateurs bénéficient d'une plus grande précision dans la recherche vectorielle sans compromettre les performances, ce qui rend la recherche vectorielle d'Elasticsearch encore plus puissante.

Conclusion

Dans cette comparaison de performances entre Elasticsearch BBQ et OpenSearch FAISS, Elasticsearch surpasse de manière significative OpenSearch pour la recherche vectorielle, atteignant des vitesses de requête jusqu'à 5 fois plus rapides et un débit 3,9 fois plus élevé en moyenne pour différents niveaux de rappel.

Les principales conclusions sont les suivantes :

Recall@10: Elasticsearch BBQ est jusqu'à 5 fois plus rapide (3,9 fois plus rapide en moyenne) et a un débit 3,2 fois plus élevé en moyenne par rapport à OpenSearch FAISS.
Recall@50: Elasticsearch BBQ est jusqu'à 5 fois plus rapide (4,2 fois plus rapide en moyenne) et a un débit 3,9 fois plus élevé en moyenne par rapport à OpenSearch FAISS.
Recall@100: Elasticsearch BBQ est jusqu'à 5 fois plus rapide (4,6 fois plus rapide en moyenne) et a un débit 3,9 fois plus élevé en moyenne par rapport à OpenSearch FAISS.

Ces résultats mettent en évidence les avantages d'Elasticsearch BBQ en termes d'efficacité et de performances, en particulier dans les scénarios de recherche vectorielle à haute dimension. La technique BBQ (Better Binary Quantization), introduite dans Elasticsearch 8.16, permet une réduction substantielle de la mémoire (~95%) tout en maintenant une qualité de classement élevée, ce qui en fait un choix supérieur pour les applications de recherche vectorielle à grande échelle.

Chez Elastic, nous innovons sans cesse pour améliorer Apache Lucene et Elasticsearch afin de fournir la meilleure base de données vectorielle pour les cas d'utilisation de recherche et d'extraction, y compris RAG (Retrieval Augmented Generation). Nos récentes avancées ont considérablement augmenté les performances, rendant la recherche vectorielle plus rapide et plus efficace en termes d'espace qu'auparavant, en s'appuyant sur les gains de Lucene 10. Ce blog est une autre illustration de cette innovation.

Signaler un problème

Pour aller plus loin

Arrêt précoce adaptatif pour HNSW dans Elasticsearch

Base vectorielle À l'intérieur d'Elastic

2 mars 2026

Arrêt précoce adaptatif pour HNSW dans Elasticsearch

Présentation d'une nouvelle stratégie adaptative d'arrêt précoce pour HNSW dans Elasticsearch.

Par: Tommaso Teofili

Indexation vectorielle jusqu'à 12 fois plus rapide dans Elasticsearch avec NVIDIA cuVS : accélération GPU : chapitre 2

Base vectorielle

3 décembre 2025

Indexation vectorielle jusqu'à 12 fois plus rapide dans Elasticsearch avec NVIDIA cuVS : accélération GPU : chapitre 2

Découvrez comment Elasticsearch atteint un débit d'indexation près de 12 fois supérieur grâce à l'indexation vectorielle accélérée par GPU et NVIDIA cuVS.

CH HM CN +5

Par: Chris Hegarty, Hemant Malik, Corey Nolet et 5 plus

Recherche multimodale de sommets avec Elasticsearch et SigLIP-2

Base vectorielle Recherche hybride+2

4 novembre 2025

Recherche multimodale de sommets avec Elasticsearch et SigLIP-2

Apprenez à mettre en œuvre la recherche multimodale texte-image et image-image en utilisant les encastrements SigLIP-2 et la recherche vectorielle Elasticsearch kNN. Objectif du projet : trouver des photos du sommet du mont Ama Dablam prises lors d'un trekking dans l'Everest.

Par: Navneet Kumar

Amélioration de la pertinence des modèles d'intégration multilingues grâce à un système hybride de classement des recherches

Base vectorielle Opérations

3 novembre 2025

Amélioration de la pertinence des modèles d'intégration multilingues grâce à un système hybride de classement des recherches

Découvrez comment améliorer la pertinence des résultats de recherche du modèle d'intégration multilingue E5 en utilisant le reranker de Cohere et la recherche hybride dans Elasticsearch.

Par: Quynh Nguyen