Modèles Jina AI

Modèles de pointe pour chaque étape du pipeline de récupération

Conçus pour la recherche, les modèles Jina offrent précision et rapidité surpassant les modèles cinq fois plus volumineux. Multilingue, multimodal natif (texte, images, audio et vidéo) sur Elasticsearch.

Veuillez essayer Jina sur Elasticsearch

Découvrez les modèles Jina AI

Nos modèles de pointe constituent la base de recherche pour des systèmes de recherche d'entreprise et de Retrieval-Augmented Generation (RAG) de haute qualité.

Lecteur
Convertir des documents complexes, des pages Web et des PDF en une entrée propre et structurée pour rechercher et les grands modèles de langage (LLMs).
Lancez-vous
Plongements
Améliorez les systèmes de recherche et de RAG grâce à des embeddings multimodaux et multilingues pour le texte, les images, l’audio, la vidéo et le code.
Lancez-vous
Reclasseur
Optimisez la pertinence grâce à un système de reclassement de classe mondiale qui offre une précision optimale pour des applications critiques telles que RAG, les assistants IA et les agents.
Lancez-vous

Compact par conception, précis dans les résultats

Passez des données brutes à des résultats de haute précision avec une seule API.

Recherche multimodale, plus de 100 langues
Les modèles de Jina fonctionnent pour le texte, les images, l’audio et la vidéo. Avec v5-omni, un seul modèle d’intégration gère les quatre modalités dans un espace partagé. Plus de 100 langues sont prises en charge de manière native, et la rechercher inter-langues fonctionne dès l’installation.
Les meilleurs résultats, et pas seulement les plus proches
Les modèles de reclassement de Jina sont des leaders éprouvés. Obtenez une précision supplémentaire avec des reclassificateurs qui re-évaluent chaque candidat par rapport à la requête originale, en utilisant une analyse approfondie pour obtenir les réponses les plus pertinentes en haut de liste.
Entraînement intelligent, modèles plus petits
Les modèles de Jina sont entraînés sur des tâches importantes pour la recherche : trouver le bon document et la meilleure réponse à partir de sources désordonnées. C'est pourquoi ils égalent ou surpassent les grands modèles pour une fraction du coût.
Rechercher sémantique sans configuration
Mappez n’importe quel champ comme semantic_text et Elasticsearch génère automatiquement des embeddings. Sur EIS, les modèles Jina proposent par défaut une recherche sémantique multilingue et multimodale prête à l’emploi sans aucune configuration.
Un appel API, c'est tout
Combinez la recherche par mots-clés traditionnelle avec la correspondance sémantique de Jina en une seule requête. Utilisez un appel API avec fusion réciproque des classements pour combiner le meilleur de chaque approche.
Lean à n'importe quelle échelle
Combinez les plongements de taille variable de Jina avec la quantification vectorielle d'Elastic (BBQ) pour réduire le stockage jusqu'à 95 % avec une perte de précision minimale. Optimisez la précision au maximum lorsque cela est crucial.

Utilisez les modèles Jina partout où vous développez

De la gestion complète à l’auto-hébergement, les modèles Jina s’adaptent à vos données. Choisissez l’accès qui vous convient.

Service d’inférence Elastic
Utilisez les modèles Jina en mode natif dans Elasticsearch sans configuration, clés API distinctes ou gestion de modèle.
Démarrez un essai gratuit sur Elastic Cloud
Jina API
Bénéficiez d’un accès direct, où que vous soyez. Appelez les modèles Jina directement depuis l’API Jina pour les utiliser en dehors d’Elasticsearch.
Découvrez l’API Embeddings Découvrez l'API Reranker Découvrez l’API Reader
Hugging Face
Téléchargez les poids des modèles et exécutez-les sur votre propre matériel avec un contrôle total sur le déploiement, l’ajustement et l’évolutivité.
Télécharger depuis Hugging Face

Nos recherches

Les modèles de Jina sont construits sur des recherches présentées lors des plus grandes conférences de machine learning (ML), notamment CVPR, NeurIPS et EMNLP. Découvrez dans nos dernières publications comment nos modèles de recherche de pointe ont été entraînés à partir de zéro.

Jina-embeddings-v5-text : distillation d'embeddings ciblée par tâche
Nous introduisons un nouveau régime d'entraînement qui combine des techniques de distillation de modèles avec une perte contrastive spécifique à la tâche pour produire des modèles d'embeddings compacts et très performants.
En savoir plus
Inversion d'embeddings via des modèles de langage de diffusion masquée conditionnelle
Nous concevons l'inversion d'intégration comme une diffusion masquée conditionnelle, en récupérant tous les jetons en parallèle par le biais d'un débruitage itératif plutôt que d'une génération autorégressive séquentielle.
En savoir plus
Compression des embeddings via les coordonnées sphériques
Nous présentons une méthode de compression pour les embeddings à norme unitaire qui atteint une compression de 1,5×, soit 25 % de mieux que la meilleure méthode sans perte précédente.
En savoir plus
jina-embeddings-v5-omni
Nous étendons jina-embeddings-v5-text aux images, audio et vidéo en composant des encodeurs pré-entraînés figés via des adaptateurs légers entraînés, sans réentraîner le modèle textuel ni réindexer les données existantes.
En savoir plus

Rejoignez notre communauté open source

Les modèles de Jina sont en accès libre et disponibles gratuitement sur Hugging Face, avec des millions de téléchargements mensuels. Le code source est public sur GitHub. La communauté a un accès direct à nos développeurs.

Hugging Face
Accédez à nos modèles pour les embeddings, les rerankers et les petits modèles de langage pour mieux rechercher.
Lancez-vous
GitHub
Explorez les modèles publics et les dépôts.
Explorer les dépôts
Communauté
Rejoignez notre communauté de développeurs.
En savoir plus
Discussion
Partagez des conseils et apprenez des autres développeurs.
Joindre

Questions fréquentes

Qu'est-ce que les modèles de recherche Jina ?

Les modèles Jina sont des modèles d'IA d'avant-garde open source pour la recherche documentaire. Ils comprennent des modèles d'intégration pour les vecteurs, des modèles de repositionnement pour la précision et des lecteurs pour l'extraction et la structuration du contenu des URL et des documents.

Ai-je besoin d’une expertise en IA ou en machine learning pour les utiliser ?

Non. Utilisez le champ semantic_text d'Elasticsearch, et le traitement de l'IA se fait automatiquement. Les modèles de Jina rendent votre contenu sémantiquement consultable — aucune configuration de modèle ou expertise ML n'est requise.

Comment puis-je me lancer ?

Les modèles Jina sont disponibles sur Elastic Inference Service sur Elastic Cloud, inclus dans tous les essais. Commencez par semantic_text, ou explorez les sous-pages de modèles pour des exemples de code, des références API et des tutoriels.

Quels modèles Jina sont disponibles aujourd’hui ?

Notre dernière version v5-text (nano/small) comprend la fonctionnalité 32K de contexte, des dimensions Matryoshka et la dernière architecture — ainsi que Jina-embeddings-v3 et Reranker v2 et v3 — tous disponibles sur Elastic Inference Service.

Combien de langues sont prises en charge ?

Jina-embeddings-v5-text prend en charge plus de 30 langues — une requête dans une langue trouve du contenu pertinent écrit dans une autre, sans qu’aucun pipeline de traduction ne soit nécessaire.

Comment cela se rapporte à ELSER ?

ELSER prend en charge la recherche sémantique en anglais. Jina ajoute une couverture multilingue sur plus de 30 langues avec une précision optimale — les deux fonctionnent au sein du framework de rechercher hybride d’Elasticsearch.

S'agit-il d'un produit distinct ?

Non. Les modèles de recherche Jina sur Elastic Inference Service sont disponibles pour tous les utilisateurs d'Elastic Cloud avec une tarification basée sur la consommation. Aucune licence, aucun abonnement ou clé API distinct n'est requis.

Comment cela se rapporte-t-il à la page de la base vectorielle d'Elastic ?

La page sur la base vectorielle explique comment les vecteurs sont stockés et recherchés à grande échelle. Cette page décrit les modèles d'IA qui les génèrent et les réorganisent. Ensemble : stockage, calcul et application.

Ingénierie du contexte

Base vectorielle

Applications optimisées pour la recherche

Logs

Protection contre les menaces

Workflows

Elasticsearch

Kibana (Discover, tableaux de bord)

Elastic Agent Builder

AutoOps

Langage de requête canalisé

Modèles de recherche Jina AI

Elastic Cloud Serverless

Elastic Cloud hébergé

Elasticsearch autogéré

Recherche sur les sites d'e-commerce

Recherche dans le service client

Applications axées sur la recherche

Analyse des logs

Suivi d'infrastructure

Suivi de l'expérience numérique

App : suivi des performances

AIOps

Observabilité des LLM

SIEM nouvelle génération

Workflows pour la sécurité

XDR et sécurité aux points de terminaison

L'IA pour la sécurité

Décuplez la valeur de vos données

Fournisseurs cloud

Écosystème IA d'Elastic

Programme de partenariat Search AI

AV-Comparatives

Leader dans le Forrester Wave™

Leader dans le Magic Quadrant de Gartner

Leader dans IDC MarketScape

Recherche

Security

Observability

Lancez-vous

Galerie de démonstrations

Téléchargements

Intégrations

Documentation

Elasticsearch Labs

Elastic Security Labs

Elastic Observability Labs

Blog

Communauté

Événements

Webinars

Discussion

Formation

Support technique

Conseil

Modèles Jina AI

Modèles de pointe pour chaque étape du pipeline de récupération

Découvrez les modèles Jina AI

Lecteur

Plongements

Reclasseur

Compact par conception, précis dans les résultats

Recherche multimodale, plus de 100 langues

Les meilleurs résultats, et pas seulement les plus proches

Entraînement intelligent, modèles plus petits

Rechercher sémantique sans configuration

Un appel API, c'est tout

Lean à n'importe quelle échelle

Utilisez les modèles Jina partout où vous développez

Service d’inférence Elastic

Jina API

Hugging Face

Nos recherches

Jina-embeddings-v5-text : distillation d'embeddings ciblée par tâche

Inversion d'embeddings via des modèles de langage de diffusion masquée conditionnelle

Compression des embeddings via les coordonnées sphériques

jina-embeddings-v5-omni

Rejoignez notre communauté open source

Hugging Face

GitHub