Elasticsearch: Crie um aplicativo de chatbot RAG
Visão geral
Introdução
Neste guia, você vai começar a configurar e executar um aplicativo de chatbot RAG. RAG significa geração aumentada de recuperação. É um método de usar uma fonte de dados personalizada para fundamentar as respostas de grandes modelos de linguagem (LLMs) de IA generativa (GenAI) para evitar problemas como alucinações de LLM. Esta jornada explica o processo de como configurar e executar o aplicativo de chatbot RAG de exemplo da Elastic para que você possa vê-lo em ação.
Este aplicativo RAG de chatbot é open source e hospedado no GitHub para que você possa cloná-lo, fazer um fork e criar sua própria versão dele. O aplicativo usa o Elastic Cloud para hospedar um índice do Elasticsearch que serve como geração aumentada de recuperação "source of truth" para o app RAG. Isso garante que as respostas geradas se baseiem nas informações dos documentos contidos no índice. O aplicativo chatbot é codificado para oferecer suporte a vários serviços LLM populares, como o OpenAI. A arquitetura do aplicativo é baseada em um backend Python Flask e um frontend React. Veja a lista completa de requisitos do aplicativo no tutorial do chatbot do Elasticsearch Labs.
O aplicativo de chatbot RAG é uma ótima maneira de aprender e experimentar aplicativos RAG porque você pode executá-lo no seu computador local e ver em primeira mão como as integrações com o Elastic Cloud e os LLMs funcionam juntas para criar uma experiência de pesquisa com tecnologia GenAI, personalizada para seu conjunto exclusivo de documentos. O aplicativo oferece suporte à integração com uma variedade de LLMs, como OpenAI, AWS Bedrock, Azure OpenAI, Google Vertex AI, Mistral AI e Cohere. Há duas maneiras de implantar o aplicativo de chatbot RAG de exemplo no seu computador local: usando Docker ou Python.
Vamos começar
Executando o aplicativo RAG do chatbot
Siga as etapas nas seções Executar o aplicativo de chatbot com Docker ou Executar o aplicativo de chatbot com Python abaixo, dependendo da sua abordagem de implantação preferida. Usar o Docker requer menos etapas, enquanto usar o Python fornecerá uma compreensão mais aprofundada de como configurar e executar os componentes de backend e frontend do aplicativo. Ambas as formas de executar o aplicativo usam o OpenAI como LLM. Depois que o aplicativo estiver em execução com o OpenAI, atualizá-lo para usar um dos outros LLMs suportados requer etapas mínimas.
Execute o aplicativo chatbot com o Docker
O processo de execução do aplicativo chatbot RAG com o Docker envolve:
- Clonando o código do app
- Criando uma implantação do Elastic Cloud
- Como criar uma chave de API da OpenAI
- Preenchendo as configurações do app
Siga este tour guiado que inclui todas as etapas necessárias para que você alcance o objetivo de executar o aplicativo no seu computador local:
Visita guiada: Execute o aplicativo RAG do chatbot com OpenAI usando Docker
Execute o app chatbot com Python
O processo de rodar o app chatbot RAG com Python envolve:
- Clonando o código do app
- Criando uma implantação do Elastic Cloud
- Como criar uma chave de API da OpenAI
- Preenchendo as configurações do app
Depois que o app e suas dependências estiverem configurados, o backend do Python do app será iniciado. Em seguida, o frontend React será iniciado para fornecer a UI do app, com a qual você poderá interagir em seu navegador.
Siga este tour guiado que inclui todas as etapas necessárias para que você alcance o objetivo de executar o app no seu computador local:
Visita guiada: Execute o app RAG do chatbot com OpenAI usando Python
Como trabalhar com o Elasticsearch
Brinque com o app em execução
Depois que o aplicativo estiver em execução, vá em frente e tente fazer uma pergunta ou usar uma das perguntas predefinidas. O aplicativo é codificado para incluir um índice Elastic que ingere o histórico dos seus bate-papos, então você deve tentar fazer perguntas de acompanhamento que testem a "memória" do chatbot.

Próximas etapas
Obrigado por reservar um tempo para aprender sobre o processo de execução do aplicativo de exemplo Elastic chatbot RAG. Ao iniciar sua jornada com a Elastic, entenda alguns componentes operacionais, de segurança e de dados que você deve gerenciar como usuário ao fazer a implantação no seu ambiente.
Tudo pronto para começar? Faça uma avaliação gratuita de 14 dias no Elastic Cloud.