在本教程中,您将构建一个大型语言模型(LLM)聊天机器人,该聊天机器人使用一种称为 "检索增强生成"(RAG)的模式。

使用 RAG 构建的聊天机器人可以克服 ChatGPT 等通用会话模型的一些局限性。特别是,他们能够讨论并回答以下问题:

  • 贵组织的私人信息。
  • 不属于训练数据集的事件,或在 LLM 完成训练后发生的事件。

另外一个好处是,RAG 有助于",使" 法律硕士以事实为依据,从而减少他们编造回答或"幻觉" 的可能性。

要做到这一点,秘诀在于通过两个步骤从法律硕士那里获得答案:

  • 首先,在检索阶段,要搜索一个或多个数据源,以获取用户的查询信息。在此搜索中找到的相关文件将被检索出来。为此,使用Elasticsearch索引是一个不错的选择,它可以让你在关键字、密集和稀疏矢量搜索方法之间进行选择,甚至是它们的混合组合。
  • 然后,在生成阶段,用户的提示将扩展到包括第一阶段检索到的文档,并向 LLM 添加指令,要求它在检索到的信息中找到用户问题的答案。扩充后的提示(包括问题的附加背景)将被发送到 LLM,以取代原始查询。

教程结构

本教程分为两个主要部分。

在第一部分中,您将学习如何运行聊天机器人 RAG 应用程序示例,这是一个具有 Python 后端和 React 前端的完整应用程序。

安装并运行示例应用程序后,本教程的第二部分将解释 RAG 实现的不同组件,以便您根据自己的需要调整示例代码。

下一个

要求

准备好打造最先进的搜索体验了吗?

足够先进的搜索不是一个人的努力就能实现的。Elasticsearch 由数据科学家、ML 操作员、工程师以及更多和您一样对搜索充满热情的人提供支持。让我们联系起来,共同打造神奇的搜索体验,让您获得想要的结果。

亲自试用