Jina AIモデル

検索パイプラインの各段階における最先端のモデル

検索に特化したJina AIモデルは、5倍の規模のモデルを凌駕する精度と速度を実現します。多言語、マルチモーダルに対応しており、Elasticsearchネイティブにも対応しました。

Jina AIモデルの紹介

当社のフロンティアモデルは、高品質のエンタープライズ検索およびRetrieval-Augmented Generation(RAG)システムの検索基盤を形成します。

  • リーダー

    複雑な文書、ウェブページ、PDFを、検索や大規模言語モデル(LLM)用のすっきりと構造化されたインプットに変換します。

  • 埋め込み

    テキスト、画像、コードのマルチモーダルおよび多言語埋め込みを活用して、検索およびRAGシステムを改善します。

  • リランカー

    RAG、AIアシスタント、エージェントなどの重要なアプリケーションに精度を提供する世界クラスのリランカーを使用して関連性を最大化します。

コンパクトな設計、正確な結果

1つのAPIで生データから高精度な結果まで。

  • マルチモーダル検索を30言語で

    Jinaのモデルはテキスト、画像、コードにまたがって機能します。Jina-vlmはビジュアルコンテンツをテキストやドキュメントと一緒に検索できます。30以上の言語がネイティブでサポートされ、言語横断検索もすぐに使えます。

  • 最も近いだけでなく、最高の結果を

    Jinaのリランキングモデルは実績のあるリーダーです。元のクエリに対してすべての候補を再評価し、詳細な分析に基づいて最も関連性の高い回答を上位に表示するリランカーにより、さらなる精度を実現します。

  • スマートなトレーニング、より小さなモデル

    Jinaモデルは、検索において重要なタスク、つまり乱雑な情報源から適切な文書と最適な回答を見つけるというタスクに特化してトレーニングされています。そのため、Jinaは、はるかに少ないコストで、より大規模なモデルに匹敵、あるいはそれを上回るパフォーマンスを発揮します。

  • 構成不要のセマンティック検索

    任意のフィールドをsemantic_textとしてマップすると、Elasticsearchが自動的に埋め込みを生成します。EISでは、Jinaモデルがデフォルトで、設定なしですぐに多言語・多モーダルなセマンティック検索を提供します。

  • たった1回のAPI呼び出しで完了

    従来のキーワード検索とJinaのセマンティックマッチングを1つのクエリで組み合わせます。逆順位融合を使用したAPI呼び出しを1回行い、それぞれのアプローチの長所を統合します。

  • あらゆる規模で効率的

    Jinaの可変サイズ埋め込みとElasticのベクトル量子化(BBQ)を組み合わせることで、精度の損失を最小限に抑えながら、ストレージを最大95%削減できます。精度が最も重要な場合には、精度を最大限に高められます。

Elasticの調査

Jinaのモデルは、CVPR、NeurIPS、EMNLPなどの主要な機械学習(ML)カンファレンスで発表された研究に基づいて構築されています。最新の論文で、当社の最先端の検索モデルがゼロからどのようにトレーニングされたかをご覧ください。
  • Jina-embeddings-v5-text:タスクをターゲットとした埋め込みディスティレーション

    モデル蒸留技術とタスク固有の対照損失を組み合わせて、コンパクトで高性能な埋め込みモデルを生成する新しいトレーニング方式を紹介します。

  • 条件付きマスク拡散言語モデルによる埋め込み反転

    埋め込み反転を条件付きマスク拡散としてフレーム化し、順次的な自己回帰生成ではなく反復的なノイズ除去を通じてすべてのトークンを並列に回復します。

  • 球面座標による埋め込み圧縮

    従来の最良のロスレス方式よりも25%優れた1.5倍の圧縮率を実現する単位ノルム埋め込みの圧縮方式を提示します。

オープンソースコミュニティに参加

Jinaのモデルはオープンウェイトで、Hugging Faceで無料で入手でき、毎月数百万回ダウンロードされています。コードベースはGitHubで公開されています。コミュニティは開発者に直接アクセスできます。

よくあるご質問

Jina検索モデルとは何ですか?

Jinaモデルは検索用のオープンソースのフロンティアAIモデルです。ベクトル用の埋め込みモデル、精度を高めるためのリランカー、URLやドキュメントからコンテンツを抽出して構造化するためのリーダーなどが含まれています。

これらを使用するにはAIや機械学習の専門知識が必要ですか?

いいえ。Elasticsearchのsemantic_textフィールドを使用するとAIによる処理が自動的に行われます。Jinaのモデルを使用すると、コンテンツをセマンティックに検索できます。モデルの設定やMLの専門知識は必要ありません。

利用を開始するにはどうすればよいですか?

Jinaのモデルは、Elastic Cloud上のElastic Inference Serviceでご利用いただけます。semantic_textから始めるか、コード例、APIリファレンス、チュートリアルのモデルサブページをご覧ください。

現在入手可能なJinaモデルはどれですか?

最新のv5-text(nano/small)は、32Kのコンテキスト、マトリョーシカ次元、最新のアーキテクチャを備えており、Jina-embeddings-v3、Reranker v2およびv3とともに、すべてElastic Inference Serviceで利用できます。

いくつの言語がサポートされていますか?

Jina-embeddings-v5-textは30以上の言語をサポートしており、ある言語でクエリを実行すると、翻訳パイプラインを必要とせずに、別の言語で書かれた関連コンテンツが見つかります。

ELSERとの関係は?

ELSERは英語のセマンティック検索をカバーします。Jinaは30言語以上の多言語をカバーし、高い精度を誇ります。どちらもElasticsearchのハイブリッド検索フレームワークで動作します。

これは別の製品ですか?

いいえ。Elastic Inference ServiceのJina検索モデルは、すべてのElastic Cloudユーザーが従量課金制で利用できます。個別のライセンス、サブスクリプション、APIキーは必要ありません。

これはElasticのベクトルデータベースページとどのように関係していますか?

ベクトルデータベースのページでは、ベクトルがどのように大規模に格納され、検索されるかを説明します。このページでは、ベクトルを生成してランク付けするAIモデルについて説明します。ストレージ、コンピュート、アプリケーションの3つを合わせてご覧ください。