Em Aprendizado de Máquina, um embedding é um vetor (uma matriz de números) que representa objetos do mundo real, como palavras, frases, imagens ou vídeos. A propriedade interessante dessas representações vetoriais é que duas representações que representam entidades do mundo real semelhantes ou relacionadas também compartilharão algumas semelhanças, de modo que as representações podem ser comparadas e uma distância entre elas pode ser calculada.
Ao pensar especificamente em termos de uma aplicação para pesquisa, realizar uma busca de embeddings no espaço vetorial tende a encontrar resultados mais relacionados a conceitos, em vez das palavras-chave exatas digitadas no comando de pesquisa.
Nesta seção do tutorial, você aprenderá como gerar embeddings usando modelos de aprendizado de máquina disponíveis gratuitamente e, em seguida, usará o suporte a banco de dados vetorial do Elasticsearch para armazenar e pesquisar esses embeddings. E, na parte final, você também combinará resultados de pesquisa vetorial e de texto completo, criando uma poderosa solução de pesquisa híbrida que oferece o melhor das duas abordagens.
Anteriormente
Busca vetorialPróximo
Geração de Incorporações