Neste tutorial, você vai construir um chatbot de modelo de linguagem amplo (LLM) que usa um padrão conhecido como Geração Aumentada por Recuperação (RAG).

Os chatbots criados com RAG podem superar algumas das limitações que os modelos conversacionais de propósito geral, como o ChatGPT, possuem. Em particular, eles são capazes de discutir e responder a perguntas sobre:

  • Informações que são privadas para sua organização.
  • Eventos que não faziam parte do conjunto de dados de treinamento ou que ocorreram após o término do treinamento do LLM.

Como benefício adicional, o RAG ajuda a "fundamentar" os alunos de nível de aprendizagem com fatos, tornando-os menos propensos a inventar uma resposta ou a "alucinar".

O segredo para alcançar esse objetivo é utilizar um processo de duas etapas para obter uma resposta do LLM:

  • Primeiramente, na fase de recuperação, uma ou mais fontes de dados são pesquisadas para atender à consulta do usuário. Os documentos relevantes encontrados nesta pesquisa são recuperados. Utilizar um índice Elasticsearch para isso é uma ótima opção, permitindo escolher entre métodos de busca por palavra-chave, vetor denso e vetor esparso, ou até mesmo uma combinação híbrida deles.
  • Em seguida, na Fase de Geração, o prompt do usuário é expandido para incluir os documentos recuperados na primeira fase, com instruções adicionais para o LLM encontrar a resposta à pergunta do usuário nas informações recuperadas. A solicitação expandida, incluindo o contexto adicional para a pergunta, é o que é enviado ao LLM em substituição à consulta original.

Estrutura do tutorial

Este tutorial está estruturado em duas partes principais.

Na primeira parte, você aprenderá como executar o exemplo do aplicativo Chatbot RAG , um aplicativo completo com um back-end em Python e um front-end em React.

Depois de ter a aplicação de exemplo em funcionamento, a segunda parte deste tutorial explica os diferentes componentes da implementação do RAG, para que possa adaptar o código de exemplo às suas próprias necessidades.

Próximo

Requisitos

Pronto para criar buscas de última geração?

Uma pesquisa suficientemente avançada não se consegue apenas com o esforço de uma só pessoa. O Elasticsearch é impulsionado por cientistas de dados, especialistas em operações de aprendizado de máquina, engenheiros e muitos outros que são tão apaixonados por buscas quanto você. Vamos nos conectar e trabalhar juntos para construir a experiência de busca mágica que lhe trará os resultados desejados.

Experimente você mesmo(a)