Modelos Jina AI

Modelos de última geração para cada estágio do pipeline de recuperação.

Projetados especificamente para recuperação, os modelos Jina AI oferecem precisão e velocidade que superam modelos 5× maiores. Multilíngues, multimodais e agora nativos no Elasticsearch.

Conheça os modelos Jina AI

Nossos modelos de ponta formam a base da busca para sistemas empresariais de busca de alta qualidade e de retrieval-augmented generation (RAG).

  • Leitor

    Converta documentos complexos, páginas web e PDFs em entradas limpas e estruturadas para busca e grandes modelos de linguagem (LLMs).

  • Embeddings

    Aprimore os sistemas de busca e RAG com embeddings multimodais e multilíngues para texto, imagens e código.

  • Reranker

    Maximize a relevância com um reclassificador de classe mundial que entrega precisão para aplicações críticas como RAG, assistentes de IA e agentes.

Compacto por concepção, preciso nos resultados

Obtenha resultados de alta precisão a partir de dados brutos em uma única API.

  • Busca multimodal, 30 idiomas

    Os modelos Jina funcionam com texto, imagens e código. O Jina-vlm torna o conteúdo visual pesquisável junto com texto e documentos. Mais de 30 idiomas são suportados nativamente e a busca entre idiomas funciona imediatamente.

  • Melhores resultados, não apenas os mais semelhantes

    Os modelos de reclassificação do Jina são líderes comprovados. Obtenha precisão extra com reclassificadores que reavaliam cada candidato em relação à consulta original, usando análise profunda para colocar as respostas mais relevantes no topo.

  • Treinamento inteligente, modelos menores

    Os modelos Jina são treinados em tarefas essenciais para a recuperação de informações: encontrar o documento correto e a melhor resposta em fontes complexas. É por isso que eles igualam ou superam modelos maiores a um custo muito menor.

  • Busca semântica sem a necessidade de configuração

    Mapeie qualquer campo como semantic_text e o Elasticsearch gera embeddings automaticamente. No EIS, os modelos Jina oferecem, por padrão, busca semântica multilíngue e multimodal pronta para uso, sem a necessidade de configuração.

  • Uma única chamada de API, só isso.

    Combine a busca tradicional por palavras-chave com a correspondência semântica do Jina em uma única consulta. Use uma chamada de API com fusão de ranking recíproco para unir o melhor de cada abordagem.

  • Enxuto em qualquer escala

    Combine as embeddings de tamanho variável do Jina com a quantização vetorial do Elastic (BBQ) para reduzir o armazenamento em até 95% com perda mínima de precisão. Aumente a precisão ao máximo quando a precisão for crucial.

Nossa pesquisa

Os modelos Jina são baseados em pesquisas apresentadas em conferências de machine learning (ML), incluindo CVPR, NeurIPS e EMNLP. Explore como nossos modelos de busca de ponta foram treinados do zero em nossas publicações mais recentes.
  • Jina-embeddings-v5-text: Distilação de Embeddings Direcionada a Tarefas

    Apresentamos um novo regime de treinamento que combina técnicas de destilação de modelos com perda contrastiva específica da tarefa para produzir modelos compactos e de alto desempenho para embeddings.

  • Inversão de Embeddings por Modelos de Linguagem de Difusão Mascarada Condicional

    Enquadramos a inversão de embeddings como difusão mascarada condicional, recuperando todos os tokens em paralelo por meio de denoising iterativo em vez de geração autorregressiva sequencial.

  • Compressão de Embeddings via Coordenadas Esféricas

    Apresentamos um método de compressão para embeddings de norma unitária que atinge uma compressão de 1,5×, 25% melhor do que o melhor método anterior sem perdas.

Faça parte da nossa comunidade open source

Os modelos Jina são de código aberto e estão disponíveis gratuitamente no Hugging Face, com milhões de downloads mensais. O código-fonte é público no GitHub. A comunidade tem acesso direto aos nossos desenvolvedores.

Perguntas frequentes

O que são os modelos de busca Jina?

Os modelos Jina são modelos de IA de ponta e open source para recuperação de informações. Eles incluem modelos de embedding para vetores, reclassificadores para precisão e leitores para extrair e estruturar conteúdo de URLs e documentos.

Preciso de experiência em IA ou machine learning para usá-los?

Não. Use o campo semantic_text do Elasticsearch e o processamento da IA acontece automaticamente. Os modelos Jina tornam seu conteúdo semanticamente pesquisável — sem a necessidade de configuração de modelos ou conhecimento em ML.

Como começar?

Os modelos Jina estão disponíveis no Elastic Inference Service no Elastic Cloud, incluídos em todos os testes. Comece com semantic_text ou explore subpáginas de modelos para exemplos de código, referências de API e tutoriais.

Quais modelos Jina estão disponíveis hoje?

Nossa versão mais recente v5-text (nano/small) apresenta o recurso de contexto de 32K, dimensões Matryoshka e a arquitetura mais recente — junto com Jina-embeddings-v3 e Reclassificador v2 e v3 — tudo disponível no Elastic Inference Service.

Quantos idiomas são suportados?

Jina-embeddings-v5-text suporta mais de 30 idiomas — uma consulta em um idioma encontra conteúdo relevante escrito em outro, sem a necessidade de pipelines de tradução.

Qual a relação disso com o ELSER?

O ELSER abrange a busca semântica em inglês. O Jina adiciona cobertura multilíngue em mais de 30 idiomas com precisão líder de mercado — ambos funcionam dentro do framework de busca híbrida do Elasticsearch.

Este é um produto separado?

Não. Os modelos de busca Jina no Elastic Inference Service estão disponíveis para todos os usuários do Elastic Cloud com preços baseados no consumo. Não é necessária nenhuma licença, assinatura ou chave de API separada.

Como isso se relaciona com a página do banco de dados vetorial da Elastic?

A página sobre o banco de dados vetorial aborda como os vetores são armazenados e pesquisados em grande escala. Esta página aborda os modelos de IA que os geram e reclassificam. Em conjunto: armazenamento, computação e aplicação.