Cohere erstellt große Sprachmodelle und macht sie über eine Reihe von APIs zugänglich. Die Einbettungsmodelle von Cohere, wie z. B.embed-english-v3.0 und embed-multilingual-v3.0, transformieren Textblöcke in Vektordarstellungen. Auf diese Modelle kann über ihre Embed-API zugegriffen werden. Diese API verfügt über einen embedding_types-Parameter, der Nutzern die Möglichkeit bietet, stark komprimierte Einbettungen zu erstellen, um Speicherkosten zu sparen.
Die generativen Modelle von Cohere, wie z. B.command-r und command--r-plus, erhalten Nutzeranweisungen und generieren nützlichen Text. Auf diese Modelle kann über die Chat-API zugegriffen werden, sodass Nutzer mehrstufige Konversationserlebnisse erstellen können. Diese API verfügt über ein Feature, das es Nutzern ermöglicht, dem Modell ihre eigenen Dokumente direkt in der Nachricht zur Verfügung zu stellen; diese können zum Verankern von Modell-Outputs verwendet werden.
Die Reranking-Modelle von Cohere, wie z. B. rerank-english-v3.0 und rerank-multilingual-v3.0, verbessern die Suchergebnisse, indem sie die abgerufenen Ergebnisse basierend auf bestimmten Parametern neu organisieren. Auf diese Modelle kann über ihre Rerank-API zugegriffen werden. Diese Modelle bieten eine „low lift, last mile“-Verbesserung der Suchalgorithmen. Zusammen können diese Modelle verwendet werden, um hochmoderne Retrieval-Augmented-Generation (RAG)-Systeme zu erstellen – wandeln Sie Ihren Text mit Embed v3 in Einbettungen um, speichern Sie ihn mit Elasticsearch, ordnen Sie die abgerufenen Ergebnisse für maximale Relevanz neu ein und übergeben Sie die abgerufenen Dokumente dynamisch an die Chat-API für fundierte Konversationen.