Cohere는 대규모 언어 모델을 구축하고 API 세트를 통해 이를 활용할 수 있도록 합니다. embed-english-v3.0 및 embed-multilingual-v3.0과 같은 Cohere의 임베딩 모델은 텍스트 청크를 벡터 표현으로 변환합니다. 이러한 모델은 Embed API를 통해 액세스할 수 있습니다. 이 API는 사용자가 스토리지 비용을 절약하기 위해 고도로 압축된 임베딩을 생성할 수 있는 embedding_types 매개변수를 제공합니다.
command-r 및 command--r-plus와 같은 Cohere의 생성형 모델은 사용자 지시사항을 받아 유용한 텍스트를 생성합니다. 이러한 모델은 Chat API를 통해 액세스할 수 있으며 사용자가 다중 회차 대화 경험을 생성할 수 있도록 지원합니다. 이 API는 사용자가 메시지에서 직접 자체 문서를 모델에 제공할 수 있는 문서 매개변수를 제공하며 이를 통해 모델 출력을 근거화할 수 있습니다.
rerank-english-v3.0 및 rerank-multilingual-v3.0과 같은 Cohere의 재순위 지정 모델은 특정 매개변수를 기반으로 검색된 결과를 재구성하여 검색 결과를 개선합니다. 이러한 모델은 Rerank API를 통해 액세스할 수 있습니다. 이러한 모델은 검색 알고리즘에 '적은 노력으로 큰 효과'를 기대할 수 있는 개선을 제공합니다. 이러한 모델들은 함께 활용하여 최첨단 Retrieval-Augmented Generation(RAG) 시스템을 구축할 수 있습니다. 먼저, 텍스트를 Embed v3를 사용해 임베딩으로 변환하고 Elasticsearch에 저장합니다. 그 다음 검색된 결과를 재순위 지정하여 관련성을 최대화하고 검색된 문서를 Chat API에 동적으로 전달해 근거 있는 대화를 구현합니다.