ハイブリッド検索がシンプルに — たった一つのAPI、確かな関連性。

Elasticsearchは、単一のAPIを通じてハイブリッド検索を追加するためのすべてのツールを提供します。そのため、複数のシステムをつなぎ合わせることなく、迅速に結果を改善し、優れた関連性を実現するための調整が可能です。

ハイブリッド検索のコア機能

ハイブリッド検索は、2つ以上の検索方法を1つのランクリストにまとめることで関連性を高める情報検索手法です。

  • 語彙検索

    レキシカル検索は特定のキーワードに基づいています。特定の事実、珍しい用語、構造化された内容に対して理想的です。

  • ベクトル検索

    ベクトル検索はセマンティックな意味に基づいています。非構造化コンテンツや意味に基づく検索において理想的です。

  • ハイブリッド検索

    ハイブリッド検索は、語彙的、意味的、地理的などの複数の検索方法を組み合わせ、実際のユースケースにおいて理想的な、優れた関連性を実現します。

Elasticsearchによるハイブリッド検索

1つのデータストアであらゆるデータタイプを検索し、Retrieval-Augmented Generation(RAG)とAIエージェントを活用して(BM25Fのようなスコアリングアルゴリズムを使用して)精度と意味理解のバランスが取れた結果を実現します。

  • ハイブリッド検索を迅速に起動して使用

    語彙検索とセマンティック検索を組み合わせることで、単一のAPIのスピードで簡単にハイブリッド検索を構築できます。完全一致と文脈上の意味のバランスを取り、複雑さを増すことなく質の高い関連性を実現します。

  • 関連性を全面的にコントロールしてカスタマイズ

    辞書的検索をELSERjina-embeddings-v3、または独自の本番環境に対応したセマンティック検索用モデルと組み合わせて、ハイブリッド検索パイプラインを構築します。そして、フィルター、ブースト、ランキング、リランキングなどの高度な技術を試して、関連性を洗練させます。

  • テキスト、画像、地理空間データにまたがるハイブリッド検索を構築

    Elasticsearchのハイブリッド検索は、お客様が必要とするあらゆる組み合わせに対応します。キーワード、セマンティック、地理空間、マルチモーダルアプローチを組み合わせることで、関連性の高い正確な検索結果を提供します。

  • 関連する文脈を取り入れ、AIエージェントの信頼性を向上

    ハイブリッド検索を使用して、データ全体の高品質なコンテキストを設計し、AIエージェントが推論し、計画を立て、行動し、より正確で信頼性の高いワークフローを構築するために必要な情報を提供します。

開発者がElasticsearchを選ぶ理由

正確さ、説明可能性、コントロールのための最良のツールを手に入れましょう。語彙検索は構造化クエリ、希少な用語、ドメイン外データに優れています。セマンティック検索は、正確な一致が不十分な場合の曖昧さと再現率を加えます。チューンスコアリング、フィルター、ブーストで連携をコントロールできます。

語彙検索
正確な、構造化された、説明可能なクエリの場合
ベクトル検索
柔軟で意味的、かつ再現性の高い検索を実現
ハイブリッド検索
両方の世界から本番レベルの関連性を実現
意味のあるスコアリング

BM25Fスコアリングを使用して、フィールドの重みと用語ブーストを完全にコントロールできます。モデルは不要です。

セマンティックに関連する結果をdense_vectorまたはsemantic_textフィールドを通じて取得します。

rank APIのreciprocal_rank_fusionまたは<options>を使って結果を組み合わせます。

クエリDSLの完全な制御

combined_fieldsboost、fuzzinesssynonyms、アナライザーを使用して関連性を調整します。

独自の埋め込みを用意するか、ELSERやOpenAIなどの搭載の推論を使用します。

共有フィルター、重み、リランクロジックを使用した単一のハイブリッドクエリを使用します。

確実に機能するフィルター

geotermrange、 ACLフィルターのネイティブサポートを取得し、大規模でも高速かつ安定して動作します。

ACORN-1は、フィルタ節をサポートした大規模データセットでも、高速なフィルタリングkNNを可能にします。

共有フィルタリングレイヤーは両方のリトリーバー間で機能し、パイプラインのステッチは必要ありません。
デバッグおよび検査機能

ドキュメントのスコアを理解するには、explainprofile_rank_featuresフィールドを使用します。

ベクトルスコアは完全に公開されており、類似度の計算や重み付けを検査できます。
両方の検索パスにわたって、各リランカーの影響に至るまで、エンドツーエンドのデバッグ可視性を実現します。
こんな時に適しています...
ログ、カタログ、識別子、コンプライアンスには、精度、フィルタリング、制御が必要です。
曖昧なクエリ、新しい用語、意味の変化、または未知の言い回しを処理しています。
奇妙なクエリの場合でも、堅牢で調整可能、説明可能な結果が必要です。
意味のあるスコアリング
クエリDSLの完全な制御
確実に機能するフィルター
デバッグおよび検査機能
こんな時に適しています...
語彙検索
正確な、構造化された、説明可能なクエリの場合
ベクトル検索
柔軟で意味的、かつ再現性の高い検索を実現
ハイブリッド検索
両方の世界から本番レベルの関連性を実現

BM25Fスコアリングを使用して、フィールドの重みと用語ブーストを完全にコントロールできます。モデルは不要です。

セマンティックに関連する結果をdense_vectorまたはsemantic_textフィールドを通じて取得します。

rank APIのreciprocal_rank_fusionまたは<options>を使って結果を組み合わせます。

combined_fieldsboost、fuzzinesssynonyms、アナライザーを使用して関連性を調整します。

独自の埋め込みを用意するか、ELSERやOpenAIなどの搭載の推論を使用します。

共有フィルター、重み、リランクロジックを使用した単一のハイブリッドクエリを使用します。

geotermrange、 ACLフィルターのネイティブサポートを取得し、大規模でも高速かつ安定して動作します。

ACORN-1は、フィルタ節をサポートした大規模データセットでも、高速なフィルタリングkNNを可能にします。

共有フィルタリングレイヤーは両方のリトリーバー間で機能し、パイプラインのステッチは必要ありません。

ドキュメントのスコアを理解するには、explainprofile_rank_featuresフィールドを使用します。

ベクトルスコアは完全に公開されており、類似度の計算や重み付けを検査できます。
両方の検索パスにわたって、各リランカーの影響に至るまで、エンドツーエンドのデバッグ可視性を実現します。
ログ、カタログ、識別子、コンプライアンスには、精度、フィルタリング、制御が必要です。
曖昧なクエリ、新しい用語、意味の変化、または未知の言い回しを処理しています。
奇妙なクエリの場合でも、堅牢で調整可能、説明可能な結果が必要です。

関連性の高いジャーニーを適切に調整

Elasticsearchは、ゼロコンフィグからフルカスタマイズまで、あらゆるレベルで関連性をコントロールすることができます。Elasticsearch Labsでチューニングの全貌をご覧ください。

  • 語彙検索から開始

    LLM不要のオリジナル技術BM25Fを使用します。

  • ハイブリッド検索を追加

    ELSERやjina-embeddings-v3など、すぐに使用できる高性能モデルと語彙検索を利用して、複雑なクエリでも優れた結果を呼び出します。

  • エキスパートモード

    リランカー、リトリーバー、Better Binary Quantization(BBQ)を使用して、ドメイン固有の検索パイプラインを出荷します。

最高レベルの性能を搭載

ElasticのファーストパーティELSERとJina AIモデルから始めましょう。これらはElasticsearchに組み込まれています。または、AIエコシステム全体で既に使用しているモデルにネイティブ統合を通じて接続することが可能です。

A four-column ecosystem diagram displaying the logos of leading AI and machine learning partners across Model Providers, Platform Providers, MLOps and orchestration tools, and Open Standard API clients. The visual shows Elastic connecting natively to the full AI stack to enhance search and power intelligent applications.

よくあるご質問

ハイブリッド検索とは?

ハイブリッド検索は、キーワード(語彙)の精度とベクトル(意味)の類似性を組み合わせるため、クエリがテキストと完全に一致しない場合でも、ユーザーは関連性の高い結果を得ることができます。