Elasticsearch Relevance Engine 是一套可帮助开发人员构建 AI 搜索应用程序的工具,包括:
- 行业领先的高级相关性排名功能,包括使用 BM25 算法(这是针对所有域进行相关度打分和实现混合搜索的基础)的传统关键字搜索。
- 完整的矢量数据库功能 — 除了存储和检索矢量外,还能够创建嵌入。
- Elastic Learned Sparse Encoder — 我们用于跨一系列域进行语义搜索的全新 Machine Learning 模型。
- 混合排名 (RRF),用于将矢量与文本型搜索功能相结合,以跨各种域实现最佳的搜索相关性。
- 支持通过 API 集成第三方转换器模型(如 OpenAI 的 GPT-3 和 GPT-4)。
- 全套的数据采集工具,如数据库连接器、第三方数据集成、网络爬虫,以及用于创建定制连接器的 API。
- 开发人员工具,可跨所有类型的数据(文本、图像、时序、地理位置、多媒体等)构建搜索应用程序。
Elasticsearch 是一种领先的搜索技术,可用于网站(如电子商务产品和发现)和内部信息(如客户成功知识库和企业搜索)等各种用例的搜索引擎。通过 ESRE,我们提供了一个工具包,用于构建 AI 驱动的搜索体验。让用户能够以自然语言、以提问的形式或描述他们所寻求信息的种类来表达他们的查询。将这种自然语言能力与生成式 AI 相结合,以通过您自己的私有数据或专有数据的上下文,进一步增强这些模型的能力。
Elasticsearch Relevance Engine 所包含的功能旨在使用 Elasticsearch 作为底层存储和搜索技术。开发人员可以使用 Elastic API 或熟悉的工具(如 Kibana),与组成 Elasticsearch Relevance Engine 的功能进行交互。
Elastic Learned Sparse Encoder 是 Elastic 为跨各种域提供高相关性语义搜索而构建的模型。目前,作为一个仅支持英语的 Machine Learning 模型,它可捕捉含义和单词之间的关系,用于信息检索。对利用我们新检索模型进行的基准测试感兴趣?请阅读这篇博文,以了解更多信息。
转换器是一种深度神经网络架构,可用作大型语言模型 (LLM) 的基础。转换器包含各种组件,可以由编码器、解码器和许多具有数百万(甚至数十亿)个参数的“深度”神经网络层组成。它们通常是基于非常大的文本语料库(如互联网上的数据)训练而成,并且可以进行微调以执行各种自然语言处理 (NLP) 任务。我们的新检索模型使用了一个转换器架构,但只包含一个专门为跨各种域进行语义搜索而设计的编码器。
作为 8.8 版本的一部分,Elasticsearch Relevance Engine 的所有功能会随 Elastic 企业搜索白金级套餐和企业级套餐一起提供。您可以轻松地开始使用嵌入和矢量搜索,并尝试检索模型。请查看 Elastic Learned Sparse Encoder 功能的演示。如果您拥有 Elasticsearch 许可证,Elasticsearch Relevance Engine 就会包含在您购买的产品中。
Elastic AI 助手是我们第一个特定领域的生成式 AI 应用程序,由 ESRE 提供技术支持。通过聊天界面,用户可以用自然语言提问,并获得量身定制的答案。有关详细信息,请阅读 Elastic AI 助手公告博文。