NVIDIA cuVS é uma biblioteca open source para busca vetorial acelerada por GPU e clustering de dados que permite buscas vetoriais e construções de índice mais rápidas.
Ele aceita análise de dados de escalabilidade, aumenta a eficiência da buscar semântica e ajuda os desenvolvedores a acelerar sistemas existentes ou compor novos desde o início.
Integrado às principais bibliotecas e bancos de dados, o cuVS gerencia atualizações complexas de código à medida que novas arquiteturas NVIDIA e versões do NVIDIA® CUDA® são lançadas, garantindo desempenho máximo e escalabilidade perfeita.
O NVIDIA NIM™ fornece containers para auto-hospedar microsserviços de inferência acelerados por GPU para modelos de IA pré-treinados e personalizados em nuvens, dados centers, PCs com IA RTX™ e estações de trabalho. Os microsserviços NIM expõem APIs padrão do setor para integração simples em aplicações de IA, frameworks de desenvolvimento e fluxo de trabalho. Desenvolvidos com base em mecanismos de inferência pré-otimizados da NVIDIA e da comunidade, incluindo NVIDIA® TensorRT™ e TensorRT-LLM, os microsserviços NIM otimizam a latência de resposta e a taxa de transferência para cada combinação de modelo básico e GPU.
- Explorando a busca vetorial acelerada por GPU no Elasticsearch com a NVIDIA
- NVIDIA NIM com banco de dados vetorial Elasticsearch
Saiba mais
- Sessão da NVIDIA GTC 2025: implemente a busca vetorial em larga escala na GPU com o Apache Lucene.