Modèles Jina AI

Modèles de pointe pour chaque étape du pipeline de récupération

Conçus pour la recherche, les modèles d'IA de Jina AI offrent une précision et une rapidité qui surpassent les modèles 5 fois plus grands. Multilingue, multimodal, et maintenant natif sur Elasticsearch.

Découvrez les modèles Jina AI

Nos modèles de pointe constituent la base de recherche pour des systèmes de recherche d'entreprise et de Retrieval-Augmented Generation (RAG) de haute qualité.

  • Lecteur

    Convertir des documents complexes, des pages Web et des PDF en une entrée propre et structurée pour rechercher et les grands modèles de langage (LLMs).

  • Plongements

    Améliorez les systèmes de rechercher et RAG grâce à des embeddings multimodaux et multilingues pour le texte, les images et le code.

  • Reclasseur

    Optimisez la pertinence grâce à un système de reclassement de classe mondiale qui offre une précision optimale pour des applications critiques telles que RAG, les assistants IA et les agents.

Compact par conception, précis dans les résultats

Passez des données brutes à des résultats de haute précision avec une seule API.

  • Rechercher multimodal, 30 langues

    Les modèles de Jina fonctionnent avec du texte, des images et du code. Jina-vlm permet de rechercher du contenu visuel au même titre que du texte et des documents. Plus de 30 langues sont prises en charge nativement, et la recherche multilingue est opérationnelle immédiatement.

  • Les meilleurs résultats, et pas seulement les plus proches

    Les modèles de reclassement de Jina sont des leaders éprouvés. Obtenez une précision supplémentaire avec des reclassificateurs qui re-évaluent chaque candidat par rapport à la requête originale, en utilisant une analyse approfondie pour obtenir les réponses les plus pertinentes en haut de liste.

  • Entraînement intelligent, modèles plus petits

    Les modèles de Jina sont entraînés sur des tâches importantes pour la recherche : trouver le bon document et la meilleure réponse à partir de sources désordonnées. C'est pourquoi ils égalent ou surpassent les grands modèles pour une fraction du coût.

  • Rechercher sémantique sans configuration

    Mappez n’importe quel champ comme semantic_text et Elasticsearch génère automatiquement des embeddings. Sur EIS, les modèles Jina proposent par défaut une recherche sémantique multilingue et multimodale prête à l’emploi sans aucune configuration.

  • Un appel API, c'est tout

    Combinez la recherche par mots-clés traditionnelle avec la correspondance sémantique de Jina en une seule requête. Utilisez un appel API avec fusion réciproque des classements pour combiner le meilleur de chaque approche.

  • Lean à n'importe quelle échelle

    Combinez les plongements de taille variable de Jina avec la quantification vectorielle d'Elastic (BBQ) pour réduire le stockage jusqu'à 95 % avec une perte de précision minimale. Optimisez la précision au maximum lorsque cela est crucial.

Nos recherches

Les modèles de Jina sont construits sur des recherches présentées lors des plus grandes conférences de machine learning (ML), notamment CVPR, NeurIPS et EMNLP. Découvrez dans nos dernières publications comment nos modèles de recherche de pointe ont été entraînés à partir de zéro.
  • Jina-embeddings-v5-text : distillation d'embeddings ciblée par tâche

    Nous introduisons un nouveau régime d'entraînement qui combine des techniques de distillation de modèles avec une perte contrastive spécifique à la tâche pour produire des modèles d'embeddings compacts et très performants.

  • Inversion d'embeddings via des modèles de langage de diffusion masquée conditionnelle

    Nous concevons l'inversion d'intégration comme une diffusion masquée conditionnelle, en récupérant tous les jetons en parallèle par le biais d'un débruitage itératif plutôt que d'une génération autorégressive séquentielle.

  • Compression des embeddings via les coordonnées sphériques

    Nous présentons une méthode de compression pour les embeddings à norme unitaire qui atteint une compression de 1,5×, soit 25 % de mieux que la meilleure méthode sans perte précédente.

Rejoignez notre communauté open source

Les modèles de Jina sont en accès libre et disponibles gratuitement sur Hugging Face, avec des millions de téléchargements mensuels. Le code source est public sur GitHub. La communauté a un accès direct à nos développeurs.

Questions fréquentes

Qu'est-ce que les modèles de recherche Jina ?

Les modèles Jina sont des modèles d'IA d'avant-garde open source pour la recherche documentaire. Ils comprennent des modèles d'intégration pour les vecteurs, des modèles de repositionnement pour la précision et des lecteurs pour l'extraction et la structuration du contenu des URL et des documents.

Ai-je besoin d’une expertise en IA ou en machine learning pour les utiliser ?

Non. Utilisez le champ semantic_text d'Elasticsearch, et le traitement de l'IA se fait automatiquement. Les modèles de Jina rendent votre contenu sémantiquement consultable — aucune configuration de modèle ou expertise ML n'est requise.

Comment puis-je me lancer ?

Les modèles Jina sont disponibles sur Elastic Inference Service sur Elastic Cloud, inclus dans tous les essais. Commencez par semantic_text, ou explorez les sous-pages de modèles pour des exemples de code, des références API et des tutoriels.

Quels modèles Jina sont disponibles aujourd’hui ?

Notre dernière version v5-text (nano/small) comprend la fonctionnalité 32K de contexte, des dimensions Matryoshka et la dernière architecture — ainsi que Jina-embeddings-v3 et Reranker v2 et v3 — tous disponibles sur Elastic Inference Service.

Combien de langues sont prises en charge ?

Jina-embeddings-v5-text prend en charge plus de 30 langues — une requête dans une langue trouve du contenu pertinent écrit dans une autre, sans qu’aucun pipeline de traduction ne soit nécessaire.

Comment cela se rapporte à ELSER ?

ELSER prend en charge la recherche sémantique en anglais. Jina ajoute une couverture multilingue sur plus de 30 langues avec une précision optimale — les deux fonctionnent au sein du framework de rechercher hybride d’Elasticsearch.

S'agit-il d'un produit distinct ?

Non. Les modèles de recherche Jina sur Elastic Inference Service sont disponibles pour tous les utilisateurs d'Elastic Cloud avec une tarification basée sur la consommation. Aucune licence, aucun abonnement ou clé API distinct n'est requis.

Comment cela se rapporte-t-il à la page de la base vectorielle d'Elastic ?

La page sur la base vectorielle explique comment les vecteurs sont stockés et recherchés à grande échelle. Cette page décrit les modèles d'IA qui les génèrent et les réorganisent. Ensemble : stockage, calcul et application.