Cohere crea grandes modelos de lenguaje y los hace accesibles a través de un conjunto de APIs. Los modelos de incrustación de Cohere, como embed-english-v3.0 y embed-multilingual-v3.0, transforman fragmentos de texto en representaciones vectoriales. Se puede acceder a estos modelos a través de su API de incrustación. Esta API presenta un parámetro embedding_types que brinda a los usuarios la opción de producir incrustaciones altamente comprimidas para ahorrar en costos de almacenamiento.
Los modelos generativos de Cohere, como command-r y command--r-plus, reciben instrucciones de usuario y generan texto útil. Se puede acceder a estos modelos a través de su API de chat, lo que permite a los usuarios crear experiencias conversacionales de varios turnos. Esta API cuenta con un parámetro de documentos que permite a los usuarios introducir sus propios documentos directamente en el mensaje; estos pueden utilizarse para fundamentar los resultados del modelo.
Los modelos de reclasificación de Cohere, como rerank-english-v3.0 y rerank-multilingual-v3.0, mejoran los resultados de búsqueda al reorganizar los resultados recuperados en función de ciertos parámetros. Se puede acceder a estos modelos a través de su API de reclasificación. Estos modelos ofrecen una mejora de fácil implementación que cubre la parte más difícil de los algoritmos de búsqueda. Juntos, estos modelos se pueden usar para crear sistemas de generación aumentada por recuperación (retrieval-augmented generation, RAG) de última generación. Con Embed v3, transforma tu texto en incrustaciones, almacénalos con Elasticsearch, reclasifica los resultados recuperados para obtener la máxima relevancia y pasa dinámicamente los documentos recuperados a la API de chat para obtener una conversación basada en datos.