欢迎 - Elasticsearch Labs

在本教程中，您将构建一个大型语言模型（LLM）聊天机器人，该聊天机器人使用一种称为 "检索增强生成"（RAG）的模式。

使用 RAG 构建的聊天机器人可以克服 ChatGPT 等通用会话模型的一些局限性。特别是，他们能够讨论并回答以下问题：

另外一个好处是，RAG 有助于"，使" 法律硕士以事实为依据，从而减少他们编造回答或"幻觉" 的可能性。

要做到这一点，秘诀在于通过两个步骤从法律硕士那里获得答案：

首先，在检索阶段，要搜索一个或多个数据源，以获取用户的查询信息。在此搜索中找到的相关文件将被检索出来。为此，使用Elasticsearch索引是一个不错的选择，它可以让你在关键字、密集和稀疏矢量搜索方法之间进行选择，甚至是它们的混合组合。
然后，在生成阶段，用户的提示将扩展到包括第一阶段检索到的文档，并向 LLM 添加指令，要求它在检索到的信息中找到用户问题的答案。扩充后的提示（包括问题的附加背景）将被发送到 LLM，以取代原始查询。

教程结构

本教程分为两个主要部分。

在第一部分中，您将学习如何运行聊天机器人 RAG 应用程序示例，这是一个具有 Python 后端和 React 前端的完整应用程序。

安装并运行示例应用程序后，本教程的第二部分将解释 RAG 实现的不同组件，以便您根据自己的需要调整示例代码。

下一个