Jina AI 模型

检索管道各阶段的先进模型

Jina AI 模型专为检索而打造,以更小的体量实现更优的准确性与速度,性能可超越体量为其 5 倍的模型。支持多语言、多模态,如今还可在 Elasticsearch 中原生使用。

认识 Jina AI 模型

我们的前沿模型为高质量企业搜索和检索增强生成(RAG)系统提供搜索基础。

  • 读者

    将复杂文档、网页和 PDF 转换为清晰、结构化的输入,供搜索和大语言模型(LLM)使用。

  • 嵌入

    借助面向文本、图像和代码的多模态、多语言嵌入,提升搜索和 RAG 系统的效果。

  • 重排序器

    借助全球领先的重排序模型,最大限度提升相关性,为 RAG、AI 助手和智能体等关键应用提供精准结果。

设计紧凑,结果精准

通过一个 API,即可从原始数据获得高精度结果。

  • 多模态搜索,支持 30 种语言

    Jina 模型可处理文本、图像和代码。Jina-vlm 让视觉内容与文本和文档一样可被搜索。原生支持 30 多种语言,并且开箱即用支持跨语言搜索。

  • 最佳结果,不止于最接近

    Jina 的重排序模型实力已获验证。借助重排序模型,可基于原始查询对每个候选结果重新评分,并通过深度分析将最相关的答案优先呈现。

  • 更聪明的训练,更小巧的模型

    Jina 模型围绕检索中的关键任务进行训练:从杂乱来源中找到合适的文档和最佳答案。因此,它们能够以更低成本匹敌甚至超越更大的模型。

  • 零配置语义搜索

    将任意字段映射为 semantic_text,Elasticsearch 即可自动生成嵌入向量。在 EIS 上,Jina 模型默认提供开箱即用的多语言、多模态语义搜索,无需配置。

  • 只需一次 API 调用

    将传统关键词搜索与 Jina 的语义匹配结合到单个查询中。只需一次 API 调用,即可利用倒数排序融合(RRF)整合两种方法的优势。

  • 任意规模下都保持精简

    将 Jina 的可变尺寸嵌入与 Elastic 的向量量化(BBQ)结合使用,可在几乎不损失准确率的情况下,将存储需求最多降低 95%。当准确性最关键时,还可将精度调至最高。

我们的研究

Jina 的模型基于发表于顶级机器学习(ML)会议的研究成果构建,包括 CVPR、NeurIPS 和 EMNLP。探索我们最新发布的论文,了解这些前沿搜索模型是如何从零开始训练的。
  • Jina-embeddings-v5-text:面向任务的嵌入蒸馏

    我们提出了一种全新的训练方案,将模型蒸馏技术与任务特定的对比损失相结合,以构建紧凑且高性能的嵌入模型。

  • 通过条件掩蔽扩散语言模型实现嵌入反转

    我们将嵌入反转视为条件掩码扩散,通过迭代去噪而不是顺序自回归生成来并行恢复所有标记。

  • 基于球坐标的嵌入压缩

    我们提出了一种适用于单位范数嵌入的压缩方法,可实现 1.5 倍压缩,压缩效果较此前最佳无损方法提升 25%。

加入我们的开源社区

Jina 的模型采用开放权重,可在 Hugging Face 上免费获取,每月下载量达数百万次。其代码库也已在 GitHub 上公开。社区成员还可直接与我们的开发人员交流。

常见问题

什么是 Jina 搜索模型?

Jina 模型是开源的、前沿的检索 AI 模型。它们包括用于向量的嵌入模型、用于提高精确度的重排序器,以及用于从 URL 和文档中提取和构建内容的读取器。

使用这些模型是否需要 AI 或机器学习专业知识?

不需要。使用 Elasticsearch 的 semantic_text 字段,AI 处理会自动完成。Jina 模型可让您的内容具备语义搜索能力,无需模型配置,也无需机器学习专业知识。

我要怎么开始呢?

Jina 模型可在 Elastic Cloud 的 Elastic Inference Service 上使用,所有试用版均已包含。您可以从 semantic_text 开始,或访问各模型子页面,查看代码示例、API 参考和教程。

目前可用的 Jina 模型有哪些?

我们最新的 v5-text(nano/small)支持 32K 上下文、Matryoshka 维度和最新架构;此外,Jina-embeddings-v3 以及 Reranker v2 和 v3 也都可在 Elastic Inference Service 上使用。

支持多少种语言?

Jina-embeddings-v5-text 支持 30 多种语言——使用一种语言发起查询,也能找到以另一种语言编写的相关内容,无需翻译管道。

这与 ELSER 有何关系?

ELSER 覆盖英文语义搜索。Jina 则以领先的准确率将多语言覆盖扩展至 30 多种语言——两者都可在 Elasticsearch 的混合搜索框架中运行。

请问这是一个独立的产品吗?

不需要。Elastic Inference Service 上的 Jina 搜索模型面向所有 Elastic Cloud 用户开放,采用按量计费模式。无需单独许可证、订阅或 API 密钥。

这与 Elastic 的向量数据库页面有什么关系?

向量数据库页面介绍了如何大规模存储和搜索向量;本页面则介绍了生成和重排序这些向量的 AI 模型。两者结合,涵盖存储、计算和应用。