Elasticsearch: Crie um aplicativo de chatbot RAG

Visão geral

Introdução

Neste guia, você vai começar a configurar e executar um aplicativo de chatbot RAG. RAG significa geração aumentada de recuperação. É um método de usar uma fonte de dados personalizada para fundamentar as respostas de grandes modelos de linguagem (LLMs) de IA generativa (GenAI) para evitar problemas como alucinações de LLM. Esta jornada explica o processo de como configurar e executar o aplicativo de chatbot RAG de exemplo da Elastic para que você possa vê-lo em ação.

Este aplicativo RAG de chatbot é open source e hospedado no GitHub para que você possa cloná-lo, fazer um fork e criar sua própria versão dele. O aplicativo usa o Elastic Cloud para hospedar um índice do Elasticsearch que serve como geração aumentada de recuperação "source of truth" para o app RAG. Isso garante que as respostas geradas se baseiem nas informações dos documentos contidos no índice. O aplicativo chatbot é codificado para oferecer suporte a vários serviços LLM populares, como o OpenAI. A arquitetura do aplicativo é baseada em um backend Python Flask e um frontend React. Veja a lista completa de requisitos do aplicativo no tutorial do chatbot do Elasticsearch Labs.

O aplicativo de chatbot RAG é uma ótima maneira de aprender e experimentar aplicativos RAG porque você pode executá-lo no seu computador local e ver em primeira mão como as integrações com o Elastic Cloud e os LLMs funcionam juntas para criar uma experiência de pesquisa com tecnologia GenAI, personalizada para seu conjunto exclusivo de documentos. O aplicativo oferece suporte à integração com uma variedade de LLMs, como OpenAI, AWS Bedrock, Azure OpenAI, Google Vertex AI, Mistral AI e Cohere. Há duas maneiras de implantar o aplicativo de chatbot RAG de exemplo no seu computador local: usando Docker ou Python.

Vamos começar

Executando o aplicativo RAG do chatbot

Siga as etapas nas seções Executar o aplicativo de chatbot com Docker ou Executar o aplicativo de chatbot com Python abaixo, dependendo da sua abordagem de implantação preferida. Usar o Docker requer menos etapas, enquanto usar o Python fornecerá uma compreensão mais aprofundada de como configurar e executar os componentes de backend e frontend do aplicativo. Ambas as formas de executar o aplicativo usam o OpenAI como LLM. Depois que o aplicativo estiver em execução com o OpenAI, atualizá-lo para usar um dos outros LLMs suportados requer etapas mínimas.

Execute o aplicativo chatbot com o Docker

O processo de execução do aplicativo chatbot RAG com o Docker envolve:

Clonando o código do app
Criando uma implantação do Elastic Cloud
Como criar uma chave de API da OpenAI
Preenchendo as configurações do app

Siga este tour guiado que inclui todas as etapas necessárias para que você alcance o objetivo de executar o aplicativo no seu computador local:

Visita guiada: Execute o aplicativo RAG do chatbot com OpenAI usando Docker

Execute o app chatbot com Python

O processo de rodar o app chatbot RAG com Python envolve:

Clonando o código do app
Criando uma implantação do Elastic Cloud
Como criar uma chave de API da OpenAI
Preenchendo as configurações do app

Depois que o app e suas dependências estiverem configurados, o backend do Python do app será iniciado. Em seguida, o frontend React será iniciado para fornecer a UI do app, com a qual você poderá interagir em seu navegador.

Siga este tour guiado que inclui todas as etapas necessárias para que você alcance o objetivo de executar o app no seu computador local:

Visita guiada: Execute o app RAG do chatbot com OpenAI usando Python

Como trabalhar com o Elasticsearch

Brinque com o app em execução

Depois que o aplicativo estiver em execução, vá em frente e tente fazer uma pergunta ou usar uma das perguntas predefinidas. O aplicativo é codificado para incluir um índice Elastic que ingere o histórico dos seus bate-papos, então você deve tentar fazer perguntas de acompanhamento que testem a "memória" do chatbot.

Próximas etapas

Obrigado por reservar um tempo para aprender sobre o processo de execução do aplicativo de exemplo Elastic chatbot RAG. Ao iniciar sua jornada com a Elastic, entenda alguns componentes operacionais, de segurança e de dados que você deve gerenciar como usuário ao fazer a implantação no seu ambiente.

Tudo pronto para começar? Faça uma avaliação gratuita de 14 dias no Elastic Cloud.

Iniciar avaliação gratuita