ElasticとRed Hat:NVIDIA GPUアクセラレーションを活用したソブリンAIファクトリーのスケーリング

Elasticを活用し、cuVS上のNVIDIA GPUの速度とRed Hat AIの柔軟性によって事業を加速させ、あらゆる環境でエンタープライズ規模のRAGとエージェント型AIのワークフローを実現するソブリンAIファクトリーを強化しましょう。

image2_(1).png
概要
  • ElasticのNVIDIA cuVSを使用したベクターインデキシングが、Red Hat AIプラットフォーム上のOpenShiftで利用可能になりました。
  • ElasticsearchとRed Hat AI(NVIDIAと統合)は、組織にKubernetesワークロードとネイティブな互換性がある包括的なプラットフォームを提供します。
  • GPUアクセラレーションによる検索と高パフォーマンスコンピューティングにより、セキュアで拡張性のあるRAG導入がハイブリッドクラウド環境全体で可能になります。

生成AIソリューションがパイロット段階を超えるにつれて、企業はAIワークロードを大規模に実行するための標準化された反復可能なインフラストラクチャーを求め、AIファクトリーに注目しています。本番環境対応のAIファクトリーには、強力なモデル、コンテキストのためのリアルタイムな知識検索、エージェント推論、そして独自データを安全に保つガイドラインが含まれます。

組織は、ビジネスが運営されているあらゆる場所(オンプレミス、クラウド、またはハイブリッド環境)でこれらのAIソリューションを実行する必要があります。

ElasticとRed Hatは連携し、それを実現しています。NVIDIA cuVSによるElasticのGPUアクセラレーテッドベクトル検索が、Red Hat AIプラットフォーム上のOpenShiftで利用可能になりました。このコラボレーションにより、企業はスケーラブルな検索、Retrieval-Augmented Generation(RAG)、およびインテリジェントなAIエージェントを自社のソブリン環境内にデプロイするための、本番環境対応の基盤を整えることができます。

RAGからエージェント型AIまで、インデキシング速度が重要な理由

企業におけるAI導入の成功事例では、ペタバイト規模の非構造化された企業の独自データからコンテキストを取得します。これらのRAGパイプラインのコアにはベクトル検索があります。しかし、データ量が増加するにつれて、これらのベクターインデックスの構築がボトルネックとなり、導入が停滞し、高額なオーバーヘッドコストを招くことがよくあります。

NVIDIA cuVSとの統合により、GPUアクセラレーションインデキシングが可能になり、Elasticはインジェスト中の計算集約型作業をオフロードします。その結果は次のような目を見張るものとなります。

  • インデキシング速度が最大12倍高速化

  • 最大7倍高速な強制マージ

  • CPU使用率が低い

Elasticは、NVIDIA Enterprise AI Factoryの検証済み設計で推奨されるベクトルデータベースとして、自律エージェントが最も関連性の高いデータにもとづいて効果的に推論し、行動できるように支えます。インデキシングの高速化により、エージェントはリアルタイムの企業データにもとづいて、大規模に意思決定を行えます。

Red Hat AIはElastic GPUアクセラレーションに適したプラットフォーム

Red Hat AIは、モデルトレーニングのためのデータ検索パイプラインから推論に至るまで、企業がAIワークロードを運用化するために必要なKubernetesネイティブの基盤を提供します。ElasticをNVIDIAアクセラレーション搭載のRed Hat AIスタックと組み合わせることで、ソブリンAIを優先するお客様にとって重大なギャップを埋めることができます。

Elastic Agent BuilderとElastic Workflowsを使用することで、開発者はOpenShift AI上のRed Hat AIで自律エージェントを構築できるようになりました。これらのエージェントは、ハイブリッドクラウド全体で情報を取得し、運用ワークフローをトリガーし、その間にデータとモデルは常に環境内に保持されます。

「Red Hat OpenShiftは、企業があらゆるハイブリッドクラウド環境でAIワークロードを運用化し、拡張するために不可欠なKubernetesネイティブの基盤を提供します」と、Red Hatでエコシステム開発担当シニアディレクターを務めるケイティ・ジグリオ氏は述べました。「Red Hat OpenShiftとRed Hat AI上で、NVIDIAの高速性を活かしたElasticのGPUアクセレレーション検索を実現することで、お客様がデータ主権を全面的に管理しながら、安全で高性能なRAGと自律型AIエージェントを構築できる、本番環境対応のオープンプラットフォームを共同で提供します。」

どこでもデプロイ、データは社内で管理

ElasticとRed Hat、そしてNVIDIAのコラボレーションにより、厳しいデータ主権規制の下にある企業は、データがどこにあっても柔軟に管理できるようになります。

  • Red Hat AIは、モデルをホストし、保護するための基盤を提供します。

  • Elasticはコンテキストレイヤーとエージェントフレームワークを提供します。

  • NVIDIAのAIインフラストラクチャーがパフォーマンスの高速化を実現します。

  • 顧客は統合を活用し、エージェント型AIシステムおよび運用化されたAgentOpsプラクティスをシームレスに展開できます。

ElasticとRed Hat AIを組み合わせることで、独自のビジネスデータとモデルをお客様が選択した環境(独自のデータセンター、クラウドリージョン、ハイブリッドアーキテクチャ)に展開できます。

ElasticとRed Hat AIの活用事例

ある金融機関について考えてみましょう。その金融機関は、顧客向けAIアシスタントをデプロイする際の規制の複雑さとインフラストラクチャーのコストに直面しています。効果的であるためには、このAIアシスタントは顧客の口座情報をチェックし、リアルタイムで疑わしい活動にフラグを立てるエージェントとして稼働する必要があります。

Red Hat AIプラットフォームでのElastic GPUアクセラレーション検索により、この金融機関は次のことができるようになりました。

  • 顧客レコードが更新されるたびに、新しい関連データを最大12倍の速度でインデックス化

  • 自律エージェントを実行して、何百万ものベクトルを検索し、関連するコンテキストを取得し、リアルタイムでアクションを実行
  • 単一の管理プラットフォーム内でAIパイプライン全体を展開・拡張
  • データ主権を全面的に管理し、安全を維持

Red Hat AIでElasticを始めましょう

GPUアクセラレーションを備えたElasticsearchはRed Hat AIプラットフォームで現在利用可能です。最初のRAGアプリケーションを構築する場合でも、グローバルスケールでAIファクトリーをデプロイする場合でも、Elastic、Red Hat、およびNVIDIAの組み合わせは、オープンソースの基盤上で現代のAIソリューションに必要なパフォーマンスと柔軟性を提供します。

本記事に記述されているあらゆる機能ないし性能のリリースおよびタイミングは、Elasticの単独裁量に委ねられます。現時点で提供されていないあらゆる機能ないし性能は、すみやかに提供されない可能性、または一切の提供が行われない可能性があります。

このブログ記事では、それぞれのオーナーが所有・運用するサードパーティの生成AIツールを使用したり、参照したりしている可能性があります。Elasticはこれらのサードパーティのツールについていかなる権限も持たず、これらのコンテンツ、運用、使用、またはこれらのツールの使用により生じた損失や損害について、一切の責任も義務も負いません。個人情報または秘密/機密情報についてAIツールを使用する場合は、十分に注意してください。提供したあらゆるデータはAIの訓練やその他の目的に使用される可能性があります。提供した情報の安全や機密性が確保される保証はありません。生成AIツールを使用する前に、プライバシー取り扱い方針や利用条件を十分に理解しておく必要があります。

Elastic、Elasticsearch、および関連するマークは、米国およびその他の国におけるElasticsearch N.V.の商標、ロゴ、または登録商標です。他のすべての会社名および製品名は、各所有者の商標、ロゴ、登録商標です。