Modelos de Jina AI

Modelos de última generación para cada etapa del pipeline

Los modelos Jina AI, diseñados específicamente para la recuperación, ofrecen precisión y velocidad que superan a los modelos que multiplican cinco veces su tamaño. Plurilingües, multimodales y ahora nativos en Elasticsearch.

Conoce los modelos de Jina AI

Nuestros modelos de frontera forman la base de búsqueda para sistemas empresariales de alta calidad de búsqueda y Retrieval-Augmented Generation (RAG).

  • Lector

    Convierte documentos complejos, páginas web y archivos PDF en una entrada limpia y estructurada para la búsqueda y los modelos de lenguaje grandes (LLMs).

  • Incrustaciones

    Mejora los sistemas de búsqueda y RAG con incrustaciones multimodales y multilingües para texto, imágenes y código.

  • Reclasificador

    Maximiza la relevancia con un clasificador de primera clase que ofrece precisión para aplicaciones críticas como RAG, asistente de IA y agentes.

De diseño compacto y resultados precisos

Convierte los datos sin procesar en resultados de alta precisión en una sola API.

  • Búsqueda multimodal, 30 idiomas

    Los modelos de Jina funcionan con texto, imágenes y código. Jina-vlm hace que el contenido visual sea buscable al igual que el texto y los documentos. Se admiten de forma nativa más de 30 idiomas; además, la búsqueda entre idiomas funciona de forma inmediata.

  • Los mejores resultados, no solo los más cercanos

    Los modelos de reclasificación de Jina lideran y están comprobados. Incrementa la precisión aún más con reclasificadores que cotejan cada candidato y la consulta original, utilizando un análisis profundo para obtener las respuestas más relevantes en la parte superior.

  • Entrenamiento inteligente, modelos más pequeños

    Los modelos de Jina están entrenados en tareas que son importantes para la recuperación: encontrar el documento correcto y la mejor respuesta de fuentes desordenadas. Es por eso que igualan o superan el rendimiento de modelos más grandes a una fracción del costo.

  • Búsqueda semántica sin configuración

    Asigna cualquier campo como semantic_text y Elasticsearch generará de forma automática las incrustaciones. En EIS, los modelos Jina ofrecen por defecto una búsqueda semántica multilingüe y multimodal lista para usar sin necesidad de configuración.

  • Una llamada a la API, eso es todo

    Combina la búsqueda de palabras clave tradicional con la coincidencia semántica de Jina en una sola consulta. Utiliza una llamada API con fusión de rango recíproco para fusionar lo mejor de cada enfoque.

  • Lean a cualquier escala

    Combina las incrustaciones de tamaño variable de Jina con la cuantificación vectorial (BBQ) de Elastic para reducir el almacenamiento hasta en un 95 % con una pérdida mínima de precisión. Aumenta la precisión al máximo cuando sea más importante.

Nuestra investigación

Los modelos de Jina se basan en investigaciones presentadas en las conferencias principales de machine learning (ML), como CVPR, NeurIPS y EMNLP. Lee nuestras últimas publicaciones para saber cómo nuestros modelos de búsqueda avanzada se entrenaron desde cero.
  • Jina-embeddings-v5-text: Destilación de incrustaciones orientadas a tareas

    Presentamos un régimen de entrenamiento novedoso que combina técnicas de destilación de modelos con pérdida contrastiva orientada a tareas para producir modelos de incrustación compactos y de alto rendimiento.

  • Inversión de incrustación mediante modelos de lenguaje de difusión enmascarada condicional

    Enmarcamos la inversión de incrustaciones como difusión condicional enmascarada, recuperando todos los tokens en paralelo a través de la eliminación iterativa de ruido en lugar de la generación autorregresiva secuencial.

  • Compresión de incrustación mediante coordenadas esféricas

    Presentamos un método de compresión para incrustaciones de norma unitaria que logra una compresión de 1.5×, un 25 % más que el mejor método sin pérdidas anterior.

Únete a nuestra comunidad de open source

Los modelos de Jina son de código abierto y están disponibles gratuitamente en Hugging Face, con millones de descargas mensuales. El código fuente es público en GitHub. La comunidad tiene acceso directo a nuestros desarrolladores.

Preguntas frecuentes

¿Qué son los modelos de búsqueda de Jina?

Los modelos de Jina son modelos de IA de vanguardia open source para la recuperación. Incluyen modelos de incrustación para vectores, clasificadores para precisión y lectores para extraer y estructurar contenido de URL y documentos.

¿Necesito conocimientos de IA o machine learning para usarlos?

No. Usa el campo semantic_text de Elasticsearch y el procesamiento de la IA se realiza automáticamente. Los modelos de Jina hacen que tu contenido sea semánticamente buscable; no se requiere configuración de modelos ni conocimientos de ML.

¿Cómo comienzo?

Los modelos de Jina están disponibles en el servicio de inferencia de Elastic en Elastic Cloud y se incluyen en todas las pruebas. Comienza con semantic_text o explora las subpáginas de modelos para obtener ejemplos de código, referencias de API y tutoriales.

¿Qué modelos de Jina están disponibles hoy?

Nuestras últimas características v5-text (nano/small) incluyen 32K de contexto, dimensiones Matryoshka y la arquitectura más reciente, junto con Jina-embeddings-v3 y Reranker v2 y v3, todo disponible en el servicio de inferencia Elastic.

¿Cuántos idiomas son compatibles?

Jina-embeddings-v5-text admite más de 30 idiomas: una consulta en un idioma encuentra contenido relevante escrito en otro, sin necesidad de pipelines de traducción.

¿Cómo se relaciona esto con ELSER?

ELSER cubre la búsqueda semántica en inglés. Jina añade cobertura multilingüe en más de 30 idiomas con precisión superior: ambos funcionan dentro del marco de trabajo de búsqueda híbrida de Elasticsearch.

¿Es este un producto independiente?

No. Los modelos de búsqueda Jina en Elastic Inference Service están disponibles para todos los usuarios de Elastic Cloud con precios basados en el consumo. No se requiere ninguna licencia, suscripción o clave API adicional.

¿Cómo se relaciona esto con la página de la base de datos vectorial de Elastic?

La página de la base de datos vectorial cubre cómo se almacenan y se realiza la búsqueda de los vectores a escala. Esta página cubre los modelos de IA que los generan y reclasifican. Juntos: almacenamiento, cómputo y aplicación.