O Elasticsearch é um banco de dados vetorial recomendado no design validado da NVIDIA Enterprise AI Factory

pawel-czerwinski-dlVvDJmqf-Q-unsplash.jpg

Elastic agora se integra ao design validado da NVIDIA Enterprise AI Factory para fornecer aos usuários um banco de dados vetorial recomendado para as fábricas de IA locais. O design validado fornece às empresas um framework para construir e implantar fábricas de IA no local.

Projeto de referência com Elasticsearch banco de dados vetorial para caso de uso de Retrieval-Augmented Generation (RAG) multimodal
Banco de dados vetorial Elasticsearch para o caso de uso de recuperação multimodal com Retrieval-Augmented Generation (RAG)

Elasticsearch: o banco de dados vetorial pronto para empresas da NVIDIA AI Factory

O design validado combina a computação acelerada da NVIDIA e o software de IA para a implantação otimizada de modelos de IA, extração de dados multimodais e geração de incorporado com o Elasticsearch — um banco de dados vetorial comprovado em escala para armazenar e procurar todos os seus dados de IA. Os clientes podem usar o Elasticsearch nas Fábricas de IA da NVIDIA para aplicações de IA agentivas usando o design validado.

O design validado pela NVIDIA Enterprise AI Factory com Elasticsearch ajuda as empresas a acelerar aplicações de IA ao fornecer um modelo pré-projetado de pilha completa.

Mas há mais na colaboração — pense em busca vetorial acelerada por GPU!

O que vem a seguir?

A Elastic usará NVIDIA cuVS, uma biblioteca de busca vetorial acelerada por GPU de código aberto, para criar um novo plugin Elasticsearch e trazer aceleração de GPU a duas áreas principais:

  1. Tempos de construção do índice: ao usar GPUs NVIDIA, você pode reduzir o tempo necessário para construir e atualizar índices vetoriais no Elasticsearch.

  2. Desempenho da consulta: ao utilizar a aceleração de GPU para buscas vetoriais kNN, o objetivo é alcançar menor latência e maior taxa de transferência nas consultas de similaridade no Elasticsearch, viabilizando as aplicações de IA em tempo real.


Esta colaboração com a NVIDIA para aceleração de GPU se baseia no trabalho anterior da equipe da Elastic para otimizar o desempenho da busca vetorial via técnicas como CPU SIMD, Better Binary Quantization (BBQ), e HNSW filtrado mais rápido, tornando o Elasticsearch o banco de dados vetorial preferido dos usuários. Fique de olho em mais atualizações no Elasticsearch Labs.

O lançamento e o tempo de amadurecimento de todos os recursos ou funcionalidades descritos neste artigo permanecem a exclusivo critério da Elastic. Os recursos ou funcionalidades não disponíveis no momento poderão não ser entregues ou não chegarem no prazo previsto.

Nesta postagem do blog, podemos ter usado ou feito referência a ferramentas de IA generativa de terceiros, que são de propriedade e operadas por seus respectivos proprietários. A Elastic não tem nenhum controle sobre as ferramentas de terceiros e não temos nenhuma responsabilidade ou obrigação por seu conteúdo, operação ou uso, nem por qualquer perda ou dano que possa surgir do uso de tais ferramentas. Tenha cuidado ao usar ferramentas de IA com informações pessoais, sensíveis ou confidenciais. Os dados que você enviar poderão ser usados para treinamento de IA ou outros fins. Não há garantia de que as informações fornecidas serão mantidas seguras ou confidenciais. Você deve se familiarizar com as práticas de privacidade e os termos de uso de qualquer ferramenta de IA generativa antes de usá-la. 

Elastic, Elasticsearch e marcas associadas são marcas comerciais, logotipos ou marcas registradas da Elasticsearch N.V. nos Estados Unidos e em outros países. Todos os outros nomes de empresas e produtos são marcas comerciais, logotipos ou marcas registradas dos respectivos proprietários.