在机器学习中,嵌入是一个向量(数字数组),代表现实世界中的对象,如单词、句子、图像或视频。这些嵌入式所具有的有趣特性是,代表相似或相关现实世界实体的两个嵌入式也会有一些相似之处,因此可以对嵌入式进行比较,并计算出它们之间的距离。
从搜索应用的具体角度考虑,在向量空间中对嵌入进行搜索,往往能找到与概念更相关的结果,而不是在搜索提示中键入的确切关键词。
在本节教程中,您将学习如何使用免费提供的机器学习模型生成嵌入式,然后使用 Elasticsearch 的向量数据库支持来存储和搜索这些嵌入式。最后,您还将结合矢量和全文搜索结果,创建一个强大的混合搜索解决方案,提供两种方法的最佳效果。