Introdução a Incorporações

Em Aprendizado de Máquina, um embedding é um vetor (uma matriz de números) que representa objetos do mundo real, como palavras, frases, imagens ou vídeos. A propriedade interessante dessas representações vetoriais é que duas representações que representam entidades do mundo real semelhantes ou relacionadas também compartilharão algumas semelhanças, de modo que as representações podem ser comparadas e uma distância entre elas pode ser calculada.

Ao pensar especificamente em termos de uma aplicação para pesquisa, realizar uma busca de embeddings no espaço vetorial tende a encontrar resultados mais relacionados a conceitos, em vez das palavras-chave exatas digitadas no comando de pesquisa.

Nesta seção do tutorial, você aprenderá como gerar embeddings usando modelos de aprendizado de máquina disponíveis gratuitamente e, em seguida, usará o suporte a banco de dados vetorial do Elasticsearch para armazenar e pesquisar esses embeddings. E, na parte final, você também combinará resultados de pesquisa vetorial e de texto completo, criando uma poderosa solução de pesquisa híbrida que oferece o melhor das duas abordagens.

Pronto para criar buscas de última geração?

Uma pesquisa suficientemente avançada não se consegue apenas com o esforço de uma só pessoa. O Elasticsearch é impulsionado por cientistas de dados, especialistas em operações de aprendizado de máquina, engenheiros e muitos outros que são tão apaixonados por buscas quanto você. Vamos nos conectar e trabalhar juntos para construir a experiência de busca mágica que lhe trará os resultados desejados.

Experimente você mesmo(a)