Cohereは大規模な言語モデルを構築し、それらを一連のAPIを通じて利用可能にします。Cohereの埋め込みモデル(embed-english-v3.0やembed-multilingual-v3.0など)は、テキストのチャンクをベクトル表現に変換します。これらのモデルには、Embed APIを通じてアクセスできます。このAPIにはembedding_typesパラメーターがあり、ストレージコストを節約するため、高度に圧縮された埋め込みを生成するオプションをユーザーに提供します。
Cohereの生成モデル(command-rやcommand--r-plusなど)は、ユーザーの指示を受け取り、有用なテキストを生成します。これらのモデルにはChat APIを通じてアクセスできるため、ユーザーは複数ターンの会話エクスペリエンスを作成できます。このAPIには、ユーザーが独自のドキュメントをメッセージで直接モデルに提供できるドキュメントパラメーターがあり、これらを使用してモデル出力の基盤を作成できます。
Cohereの再ランク付けモデル( rerank-english-v3.0やrerank-multilingual-v3.0など)は、特定のパラメータに基づいて取得された結果を再編成することで、検索結果を改善します。これらのモデルには、 Rerank APIを通じてアクセスできます。これらのモデルは、検索アルゴリズムに低負荷かつ微調整を含む改善をもたらします。これらのモデルを組み合わせることで、最先端のRetrieval-Augmented Generation(RAG)システムを構築することができます。これにより、Embed v3でテキストを埋め込みに変換し、それをElasticsearchで格納し、取得した結果の関連性を最大限に高めるために再ランク付けし、取得したドキュメントをChat APIに動的に渡して、理路整然とした会話を行うことができます。