In diesem Tutorial werden Sie einen Chatbot mit einem großen Sprachmodell (LLM) erstellen, der ein Muster namens Retrieval-Augmented Generation (RAG) verwendet.

Mit RAG erstellte Chatbots können einige der Einschränkungen überwinden, die allgemeine Konversationsmodelle wie ChatGPT aufweisen. Insbesondere können sie Fragen zu folgenden Themen diskutieren und beantworten:
- Informationen, die nur für Ihre Organisation bestimmt sind.
- Ereignisse, die nicht Teil des Trainingsdatensatzes waren oder die nach Abschluss des LLM-Trainings stattfanden.
Ein weiterer Vorteil von RAG ist, dass es LLMs hilft, sich auf Fakten zu stützen, wodurch die Wahrscheinlichkeit sinkt, dass sie eine Antwort erfinden oder Halluzinationen haben.
Das Geheimnis, um dies zu erreichen, besteht darin, ein zweistufiges Verfahren anzuwenden, um eine Antwort vom LLM zu erhalten:
- Zunächst wird in der Abrufphase eine oder mehrere Datenquellen nach der Suchanfrage des Benutzers durchsucht. Die relevanten Dokumente, die bei dieser Suche gefunden werden, werden abgerufen. Die Verwendung eines Elasticsearch- Index ist hierfür eine hervorragende Option, da Sie zwischen Keyword-, Dense- und Sparse-Vektor-Suchmethoden oder sogar einer hybriden Kombination davon wählen können.
- In der Generierungsphase wird die Benutzereingabe um die in der ersten Phase abgerufenen Dokumente erweitert und dem LLM werden zusätzliche Anweisungen gegeben, um die Antwort auf die Frage des Benutzers in den abgerufenen Informationen zu finden. Die erweiterte Fragestellung, einschließlich des zusätzlichen Kontextes, wird anstelle der ursprünglichen Anfrage an das LLM gesendet.
Tutorialstruktur
Dieses Tutorial ist in zwei Hauptteile gegliedert.
Im ersten Teil lernen Sie, wie Sie das Chatbot RAG App- Beispiel ausführen, eine vollständige Anwendung mit einem Python-Backend und einem React-Frontend.
Sobald die Beispielanwendung einsatzbereit ist, erklärt der zweite Teil dieses Tutorials die verschiedenen Komponenten der RAG-Implementierung, damit Sie den Beispielcode an Ihre eigenen Bedürfnisse anpassen können.
Nächste
Voraussetzungen