A Elastic e a NVIDIA ajudam a implantar apps de IA mais sem esgotar a infraestrutura de TI
Elimine gargalos. Expanda de forma inteligente. Controle custos. Com a Elastic e a NVIDIA, você tem o poder de um banco de dados vetorial acelerado por GPU para IA de alto desempenho.

Acompanhe as análises detalhadas
Aumente o desempenho da IA com a busca vetorial acelerada por GPU
O Elasticsearch está se unindo à NVIDIA para trazer o melhor da GPU para sua stack de busca. Ao aproveitar a biblioteca cuVS e o algoritmo CAGRA, o Elasticsearch desbloqueou um enorme paralelismo para fornecer indexação rápida e de latência ultrabaixa para seus pipelines de retrieval-augmented generation (RAG) e aplicações de IA mais exigentes.
Indexe em GPUs para ter a máxima taxa de transferência. Busque em CPUs para ter eficiência de custos. Otimize tanto o desempenho quanto o preço.

Perguntas frequentes
A indexação vetorial acelerada por GPU para o Elasticsearch está disponível como open source?
A indexação vetorial acelerada por GPU para o Elasticsearch está disponível como open source?
Sim, o código que implementa a indexação vetorial acelerada por GPU é open source (sob licença dupla: AGPL e ELv2). O Elasticsearch expõe a funcionalidade de indexação vetorial acelerada por GPU por meio de um plugin licenciado sob a licença ELv2 e disponível no plano Empresarial. O NVIDIA cuVS, a biblioteca que viabiliza os recursos de indexação por GPU no Elasticsearch, também está disponível como open source sob a licença Apache 2.0.
O que devo fazer se encontrar problemas ou tiver sugestões?
O que devo fazer se encontrar problemas ou tiver sugestões?
Em caso de problemas, consulte nossas instruções de solução de problemas. Se o problema persistir, abra um chamado no GitHub do Elasticsearch, se for um problema específico do Elasticsearch. Se o problema estiver relacionado ao NVIDIA cuVS e as dependências, abra um chamado no GitHub do NVIDIA cuVS. Se você tiver uma assinatura empresarial, entre em contato conosco pelos canais de suporte ao cliente da Elastic para ter uma solução. Use os mesmos canais para sugestões e solicitações de recursos.
Como faço para instalar o NVIDIA cuVS em um nó de dados do Elasticsearch para habilitar a indexação vetorial da GPU?
Como faço para instalar o NVIDIA cuVS em um nó de dados do Elasticsearch para habilitar a indexação vetorial da GPU?
Você pode instalar o NVIDIA cuVS como um pacote pré-compilado via tarball dos canais da NVIDIA para usuários de banco de dados ou via pip ou gerenciadores de pacotes conda para usuários de ciência de dados. Você também pode compilar o cuVS a partir do código-fonte e manter o binário por conta própria. Para mais informações, consulte a página de instalação do NVIDIA cuVS. Para usuários com assinatura NVIDIA AI Enterprise (NVAIE) com suas GPUs, o tarball do cuVS com suporte para correções de CVE e garantias de suporte para CVEs estará disponível no catálogo NGC em alguns meses. Entre em contato com a equipe de suporte da NVAIE ou com seu representante de vendas da NVIDIA para saber mais.
A indexação vetorial pode escalar entre múltiplas GPUs em um ou vários servidores?
A indexação vetorial pode escalar entre múltiplas GPUs em um ou vários servidores?
Sim, você pode usar um sistema de orquestração de contêineres como o Kubernetes para mapear cada processo do Elasticsearch para uma GPU disponível. Um único processo do Elasticsearch deve ter o uso exclusivo de uma única GPU. Dessa forma, o redimensionamento para usar várias GPUs se torna o redimensionamento de nós no cluster.
O tamanho do índice vetorial é limitado pela memória disponível da GPU?
O tamanho do índice vetorial é limitado pela memória disponível da GPU?
Oferecemos suporte à criação de índices maiores que a memória da GPU (também conhecidos como fora da memória principal) por meio da criação em lotes. No geral, a indexação por GPU não apresentam limitações adicionais além daquelas já presentes na indexação baseada em CPU.
A aceleração de GPU está disponível para busca vetorial?
A aceleração de GPU está disponível para busca vetorial?
Não, atualmente apenas a construção do índice HNSW é acelerada por GPU. O gráfico HNSW resultante é então carregado na memória do host (CPU), e a recuperação de vetores é executada na CPU. A justificativa para essa decisão reside na imensa vantagem que as GPUs possuem em operações vetoriais em massa. A expansão do uso de GPUs será considerada conforme a tecnologia e os casos de uso evoluírem.
Como avalio o desempenho e o custo-benefício da indexação vetorial de GPU?
Como avalio o desempenho e o custo-benefício da indexação vetorial de GPU?
Você pode usar a ferramenta Rally da Elastic para avaliar o impacto das GPUs na taxa de transferência de indexação, na latência de mesclagem forçada e na precisão e latência/taxa de transferência da busca vetorial. Veja as instruções e as práticas recomendadas para executar testes de desempenho de indexação vetorial E2e de ponta a ponta em GPUs usando o Rally.
Quais tipos de elementos e índices são suportados?
Quais tipos de elementos e índices são suportados?
O Elasticsearch suporta diversos parâmetros de indexação diferentes. Os valores hnsw e int8_hnsw são suportados para o parâmetro index_options.type. Para o parâmetro element_type, apenas float é suportado. No momento, nenhum outro tipo de índice ou elemento é suportado.


