Cohere construit de grands modèles de langage et les rend accessibles via un ensemble d’API. Les modèles d’intégration de Cohere, tels que embed-english-v3.0 et embed-multilingual-v3.0, transforment des morceaux de texte en représentations vectorielles. Ces modèles sont accessibles via leur API Embed. Cette API dispose d'un paramètre embedding_types qui donne aux utilisateurs la possibilité de produire des intégrations hautement compressées pour économiser sur les coûts de stockage.
Les modèles génératifs de Cohere, tels que command-r et command--r-plus, reçoivent des instructions utilisateur et génèrent du texte utile. Ces modèles sont accessibles via leur API Chat, ce qui permet aux utilisateurs de créer des expériences conversationnelles à plusieurs tours. Cette API dispose d’un paramètre documents qui permet aux utilisateurs de fournir au modèle leurs propres documents directement dans le message. Ceux-ci peuvent être utilisés pour ancrer les sorties du modèle.
Les modèles de reclassement de Cohere, tels que rerank-english-v3.0 et rerank-multilingual-v3.0, améliorent les résultats de recherche en réorganisant les résultats récupérés en fonction de certains paramètres. Ces modèles sont accessibles via l'API Rerank. Ces modèles apportent aux algorithmes de recherche une touche finale qui s’obtient facilement. Conjointement, ces modèles servent à créer des systèmes de RAG d’avant-garde : convertissez votre texte en intégrations avec Embed v3, entreposez-les dans Elasticsearch, réordonnez les résultats récupérés pour une pertinence optimale et transférez de manière dynamique les documents récupérés à l’API de clavardage pour une conversation documentée.