Vertex AIは、さまざまなAPIを通じて多様な生成AIモデル・スイートを提供し、幅広いユースケースに対応するインテリジェントなアプリケーション構築を可能にします。Google社の高度な研究を活用したこれらのモデルにより、テキストの生成、言語の翻訳、さまざまな種類のクリエイティブ・コンテンツの作成、有益な情報を提供する質問への回答が可能になります。
Gemini API
Google Geminiモデルは、マルチモーダルアプリケーション向けに設計されています。Geminiモデルは、テキストや画像などを含むプロンプトを受け入れ、テキスト応答を返します。Geminiは関数呼び出しもサポートしており、開発者は関数の説明を渡すことができ、モデルはその説明に最も一致する関数とパラメータを返します。開発者は外部APIおよびサービスでその関数を呼び出すことができます。
Gemini 1.5 Pro:この高度なモデルは、大きなコンテキストウィンドウを備え、最大100万トークンを処理し、複雑なプロンプトのニュアンスを含む理解と包括的な応答の生成を可能にします。
Gemini 1.0 Pro & Gemini 1.0 Pro Vision:これらのモデルは、自然言語タスク、マルチターン会話、コード生成に最適です。また、画像、PDF、ビデオをプロンプトに組み込むことができるため、マルチモーダルアプリケーションに多目的に使用できます。
Gemini 1.0 Ultra およびGemini 1.0 Ultra Vision:Googleの最も有能なマルチモーダルモデルとして、命令の理解、コード生成、推論を含む複雑なタスク向けに最適化されています。複数の言語をサポートしており、現在は一部のユーザーのみが利用できます。
テキスト埋め込み
Enbeddings for Text(textembedding-gecko)はテキスト埋め込みをサポートするモデルの名前です。テキスト埋め込みは、テキストデータを機械学習アルゴリズム、特に大規模モデルで処理できる数値ベクトルに変換するNLPの技術です。これらのベクトル表現は、それらが表す単語のセマンティックな意味とコンテキストを捉えるように設計されています。
埋め込み用にはいくつかのバージョンが利用可能です。textembedding-gecko@003はAIの品質を向上させた最新の安定した埋め込みモデルであり、textembedding-gecko-multilingual@001は英語以外の多くの言語に最適化されたモデルです。
マルチモーダル埋め込み
Enbeddings for Multimodal(multimodalembedding)モデルは、提供されたインプットに基づいて次元ベクトル(128、256、512、または1408次元)を生成します。このインプットには、テキスト、画像、動画の任意の組み合わせを含めることができます。これらの埋め込みベクトルは、画像分類やコンテンツモデレーションなどの他の後続タスクに使用できます。
テキスト、画像、動画の埋め込みベクトルは、同じ次元を持つ同じ意味空間にあります。したがって、これらのベクトルは、テキストによる画像検索や画像による動画検索などのユースケースで相互に使用できます。
使い始める
- Vertex AIとElasticsearch Open Inference APIの統合による再ランク付け
- Geminiを使用して、数分でRAGアプリケーションを反復・作成
- Vertex AIをElasticsearchと併用して発揮される、データのパワー
ノートブック
- Gemini EmbeddingsとElasticsearchを用いたベクトル検索
- Gemini、Langchain、Elasticsearch を使用した質問応答
- Gemmaを用いたプライベートデータでのRAG