Elasticsearch: Erstellung einer Chatbot-RAG-App

Überblick

Einführung

In diesem Leitfaden erfahren Sie die ersten Schritte zur Einrichtung und Ausführung einer Chatbot-RAG-App. RAG steht für Retrieval-Augmented Generation Dabei handelt es sich um eine Methode, bei der eine benutzerdefinierte Datenquelle zur Erdung der Antworten großer Sprachmodelle (LLMs) der generativen KI (GenAI) verwendet wird, sodass Probleme wie LLM-Halluzinationen vermieden werden. Im Folgenden erfahren Sie, wie Sie die beispielhafte Chatbot-RAG-App von Elastic konfigurieren und ausführen, damit Sie sie selbst in Aktion erleben.

Die Chatbot-RAG-App ist als Open Source verfügbar und wird auf GitHub gehostet. Dadurch können Sie sie klonen, forken und Ihre eigene Version davon erstellen. Die App nutzt Elastic Cloud, um einen Elasticsearch-Index zu hosten, der als „Quelle der Wahrheit“ für die RAG-App dient und die Suche erweitert. Somit wird sichergestellt, dass die Antworten auf den Informationen der im Index enthaltenen Dokumente basieren. Die Chatbot-App ist auf die Unterstützung mehrerer beliebter LLM-Dienste wie OpenAI ausgerichtet. Dabei basiert die Architektur der App auf einem Python-Flask-Backend und einem React-Frontend. Die vollständige Liste der Anforderungen der App finden Sie im Chatbot-Tutorial von Elasticsearch Labs.

Die Chatbot-RAG-App ist eine ausgezeichnete Möglichkeit, die RAG-Apps kennenzulernen und mit ihnen zu experimentieren, da Sie sie auf Ihrem lokalen Computer ausführen und aus erster Hand erleben, wie die Integrationen mit Elastic Cloud und LLMs zur Schaffung eines GenAI-gestützten Sucherlebnisses zusammenarbeiten, das auf Ihren individuellen Dokumentensatz abgestimmt ist. Die App unterstützt die Integration mit einer Vielzahl von LLMs wie OpenAI, AWS Bedrock, Azure OpenAI, Google Vertex AI, Mistral AI und Cohere. Es stehen zwei Möglichkeiten für die Bereitstellung der beispielhaften Chatbot-RAG-App auf Ihrem lokalen Computer zur Verfügung: mit Docker oder Python.

Los geht's

Ausführung der Chatbot-RAG-App

Folgen Sie je nach Ihrem bevorzugten Deployment-Ansatz den Schritten in den Abschnitten „Chatbot-App mit Docker ausführen“ oder „Chatbot-App mit Python ausführen“ weiter unten. Die Verwendung von Docker erfordert weniger Schritte, während die Verwendung von Python ein tieferes Verständnis der Konfiguration und Ausführung der Backend- und Frontend-Komponenten der App vermittelt. Beide Ausführungsarten der App verwenden OpenAI als LLM. Sobald die App mit OpenAI ausgeführt wird, sind nur noch wenige Schritte erforderlich, um die App zur Verwendung eines der anderen unterstützten LLMs zu aktualisieren.

Ausführung der Chatbot-App mit Docker

Der Prozess zur Ausführung der Chatbot-RAG-App mit Docker umfasst:

Klonen des Codes der App
Erstellung eines Elastic Cloud-Deployments
Erstellung eines API-Schlüssels für OpenAI
Einrichtung der Einstellungen der App

Folgen Sie dieser Anleitung mit allen Schritten, die für die Ausführung der App auf Ihrem lokalen Computer erforderlich sind:

Geführte Tour: Ausführung der Chatbot-RAG-App mit OpenAI unter Verwendung von Docker

Ausführung der Chatbot-App mit Python

Der Prozess zur Ausführung der Chatbot-RAG-App mit Python umfasst:

Klonen des Codes der App
Erstellung eines Elastic Cloud-Deployments
Erstellung eines API-Schlüssels für OpenAI
Einrichtung der Einstellungen der App

Sobald die App und ihre Abhängigkeiten konfiguriert sind, wird das Python-Backend der App gestartet. Anschließend wird das React-Frontend gestartet, um die Benutzeroberfläche der App bereitzustellen, mit der Sie in Ihrem Browser interagieren können.

Folgen Sie dieser Anleitung mit allen Schritten, die für die Ausführung der App auf Ihrem lokalen Computer erforderlich sind:

Geführte Tour: Ausführung der Chatbot-RAG-App mit OpenAI unter Verwendung von Python

Arbeiten mit Elasticsearch

Spielen Sie mit der laufenden App

Sobald Sie die App gestartet haben, können Sie eine Frage stellen oder eine der voreingestellten Fragen verwenden. Die App ist so programmiert, dass sie einen Elastic-Index enthält, der den Verlauf Ihrer Chats aufnimmt. Sie sollten also versuchen, Folgefragen zu stellen, die das „Gedächtnis“ des Chatbots testen.

Wie geht es weiter?

Vielen Dank, dass Sie sich die Zeit genommen haben, sich mit dem Ablauf der Ausführung der Beispiel-App „Elastic Chatbot RAG“ vertraut zu machen. Für Ihre Elastic-Journey sollten Sie die wichtigsten operativen, Security- und Datenkomponenten kennen, die Sie als Nutzer:in verwalten müssen, wenn Sie einen Cluster in Ihrer Umgebung bereitstellen.

Bereit loszulegen? Starten Sie eine kostenlose 14-tägige Testversion in Elastic Cloud.

Kostenlosen Test starten