Elastic y NVIDIA te permiten implementar aplicaciones de IA más rápido sin agotar la infraestructura de TI

Elimina los cuellos de botella. Escala de forma más inteligente. Controla los costos. Con Elastic y NVIDIA, obtienes el poder de una base de datos vectorial acelerada por GPU para una IA de alto rendimiento.

Análisis más a fondo

Explorando la búsqueda vectorial acelerada por GPU en Elasticsearch con NVIDIA
Más información
Indexación vectorial 12 veces más rápida con GPU de NVIDIA
Más información
Búsqueda vectorial a escala masiva: Potenciar Lucene con GPU
Ve a demanda

Libera el rendimiento de la IA con la búsqueda vectorial acelerada por GPU

Elasticsearch se ha asociado con NVIDIA para llevar el poder de la GPU a tu pila de búsqueda. Al aprovechar la biblioteca cuVS y el algoritmo CAGRA, Elasticsearch ha desbloqueado un paralelismo masivo para ofrecer un indexado rápido y con una latencia ultrabaja para tus pipelines de Retrieval-Augmented Generation (RAG) y aplicaciones de IA más exigentes.

Indexa en GPU para el máximo rendimiento. Haz una búsqueda en CPU para obtener rentabilidad. Optimiza tanto el rendimiento como el precio.

Los datos hablan

12s
Aumento en el rendimiento de indexación
7x
Reducción en la latencia de fusión
5x
Rendimiento ajustado por costo frente a solo CPU

Base de datos vectorial de Elasticsearch con NVIDIA cuVS: mejor juntos

Acelera tu fábrica de IA
Lanza búsquedas de alto rendimiento e IA agéntica más rápido con planos prediseñados. Elasticsearch es la base de datos vectorial recomendada para el diseño validado de NVIDIA Enterprise AI Factory, proporcionando un marco de trabajo confiable local para escalar.
Velocidad de indexación de turbocarga
Indexa tus datos a escala sin cuellos de botella. La integración de NVIDIA cuVS ofrece hasta un aumento de 12 veces en el rendimiento de indexación y una fusión forzada 7 veces más rápida, permitiéndote manejar volúmenes masivos de datos con una eficiencia sin precedentes.
Maximizar el valor de la infraestructura
Descarga la indexación intensiva en matemáticas a las GPU para reducir la carga de la CPU y recuperar recursos. Ajustado a costos, la aceleración por GPU ofrece un rendimiento 5 veces mayor y fusiones forzadas 6 veces más rápidas, ofreciéndote un rendimiento superior dentro de tu presupuesto de hardware actual.
Mejorar el rendimiento de las búsquedas
Maneja volúmenes masivos de búsquedas con tiempos de respuesta casi instantáneos. La búsqueda acelerada por NVIDIA de Elastic garantiza que tu infraestructura escale junto con la próxima generación de GenAI, ofreciendo la recuperación de alta velocidad necesaria para flujos de trabajo complejos y dinámicos.

PARA EMPRESARIAL

Lo mejor de Elastic y NVIDIA, optimizado para ti

Abierto y listo para el entorno empresarial
Construye con confianza sobre una base de innovación open source. El aceleramiento por GPU está impulsado por la biblioteca NVIDIA cuVS con licencia Apache 2.0 e integrado en Elasticsearch mediante un plugin con licencia ELv2, combinando flexibilidad abierta con soporte empresarial.
Escala de indexación ilimitada
Indexa tus datos a escala sin cuellos de botella. La integración de NVIDIA cuVS ofrece un aumento de 12 veces en el rendimiento de indexación y una fusión forzada 7 veces más rápida, lo que te permite manejar volúmenes masivos de datos con una eficiencia sin precedentes.
Escalar Elastic con Kubernetes
Escala tu aceleración tan fácilmente como escalas tu clúster. Al hacer mapping de procesos de Elasticsearch a GPU individuales mediante la orquestación de Kubernetes, puedes distribuir grandes cargas de indexación entre varios servidores para maximizar el rendimiento paralelo.
Sinergia perfecta entre CPU y GPU
Obtén lo mejor de ambos mundos. Elastic aprovecha las GPU para lo que mejor hacen: aritmética en volumen para la construcción de grafos, mientras mantiene la búsqueda en la CPU. Esto garantiza que tus grafos HNSW de alto rendimiento se construyan en tiempo récord, pero sigan siendo accesibles para su recuperación estándar.

Preguntas frecuentes

¿La indexación vectorial acelerada por GPU para Elasticsearch está disponible como open source?

Sí, el código que implementa la indexación de vectores acelerada por GPU es open source (bajo una licencia dual: AGPL y ELv2). Elasticsearch expone la funcionalidad de indexación de vectores acelerada por GPU a través de un plugin que está licenciado bajo la licencia ELv2 y está disponible en el nivel de suscripción Empresarial. NVIDIA cuVS, la biblioteca que impulsa las características de indexación de GPU en Elasticsearch, también está disponible como open source bajo la licencia Apache 2.0.

¿Qué debo hacer si tengo problemas o sugerencias?

Si tienes algún problema, consulta nuestras instrucciones de solución de problemas. Si el problema persiste, crea una incidencia en el GitHub de Elasticsearch si se trata de un problema específico de Elasticsearch. Si el problema se refiere a NVIDIA cuVS y sus dependencias, abre una incidencia en el GitHub de NVIDIA cuVS. Si tienes una suscripción Empresarial, contáctanos a través de los canales de atención al cliente de Elastic para obtener una solución. Emplea los mismos canales para sugerencias y solicitudes de características.

¿Cómo instalas NVIDIA cuVS en un nodo de datos de Elasticsearch para habilitar la indexación vectorial por GPU?

Puedes instalar NVIDIA cuVS como paquete precompilado mediante un tarball desde los canales de NVIDIA para usuarios de bases de datos o mediante los gestores de paquetes pip o conda para usuarios de ciencia de datos. También puedes compilar cuVS desde el código fuente y mantener el binario por ti mismo. Para obtener más información, consulta la página de instalación de NVIDIA cuVS. Para usuarios con suscripción a NVIDIA AI Empresarial (NVAIE) con tus GPU, el tarball de cuVS compatible con correcciones de CVE y garantías de compatibilidad estará disponible a través del catálogo de NGC en unos meses. Para obtener más información, ponte en contacto con el equipo de soporte de NVAIE o con tu representante de ventas de NVIDIA.

¿Puede la indexación vectorial escalar entre varias GPU en uno o varios servidores?

Sí, puedes usar un sistema de orquestación de contenedores como Kubernetes para asignar cada proceso de Elasticsearch a una GPU disponible. Un solo proceso de Elasticsearch debería tener uso exclusivo de una sola GPU. De esta manera, el escalado para usar varias GPU se convierte en el escalado de nodos en el clúster.

¿El tamaño del índice de vectores está limitado por la memoria disponible de la GPU?

Permitimos la construcción de índices que son mayores que la memoria GPU (es decir, fuera de núcleo) construyéndolos por lotes. En general, la indexación por GPU no introduce limitaciones adicionales más allá de las ya presentes con la indexación basada en CPU.

¿Está disponible la aceleración de GPU para la búsqueda vectorial?

No, actualmente solo la construcción de índices HNSW se acelera mediante GPU. El grafo HNSW resultante se carga en la memoria del host (CPU) y la recuperación de vectores se ejecuta en la CPU. Esta decisión se basa en el gran beneficio que ofrecen las GPU en las operaciones vectoriales masivas. Se considerará ampliar el uso de la GPU a medida que la tecnología y los casos de uso evolucionen.

¿Cómo puedo evaluar el rendimiento y los beneficios de costos de la indexación vectorial de GPU?

Puedes usar la herramienta Rally de Elastic para evaluar el impacto de las GPU en el rendimiento de indexación, la latencia de fusión forzada y la precisión, latencia y rendimiento de la búsqueda vectorial. Consulta las instrucciones y mejores prácticas para ejecutar la evaluación de rendimiento de indexación vectorial de extremo a extremo en GPU a través de Rally.

¿Qué tipos de elementos e índices son compatibles?

Elasticsearch admite varios parámetros de indexación diferentes. Se admiten tanto hnsw como int8_hnsw para el parámetro index_options.type. Para el element_type, solo se admite float. Por ahora, no se admiten otros tipos de índice ni de elementos.

Ingeniería de contexto

Base de datos vectorial

Aplicaciones basadas en búsqueda

Logs

Protección contra amenazas

Flujos de trabajo

Elasticsearch

Kibana (Discover, dashboards)

Elastic Agent Builder

AutoOps

Lenguaje de búsqueda con barras verticales

Modelos de búsqueda de Jina AI

Elastic Cloud Serverless

Elastic Cloud Hosted

Elasticsearch autogestionado

Búsqueda para comercio electrónico

Búsqueda para atención al cliente

Apps basadas en búsqueda

Analíticas de logs

Monitoreo de infraestructura

Monitoreo de la experiencia digital

Monitoreo del rendimiento de las apps

AIOps

Observabilidad de LLM

SIEM de próxima generación

Flujos de trabajo para seguridad

XDR y seguridad de endpoint

AI aplicada a la seguridad

10 veces el valor de tus datos

Proveedores Cloud

Ecosistema de AI de Elastic

Search AI Partner Program

AV-Comparatives

Líder en Forrester Wave™

Líder en el Magic Quadrant de Gartner

Líder en IDC MarketScape

Search

Seguridad

Observabilidad

Comienza

Galería de demostraciones

Descargas

Integraciones

Documentos

Elasticsearch Labs

Elastic Security Labs

Elastic Observability Labs

Blog

Comunidad

Eventos

Webinars

Analiza

Capacitación

Soporte

Consultoría

Elastic y NVIDIA te permiten implementar aplicaciones de IA más rápido sin agotar la infraestructura de TI

Análisis más a fondo

Explorando la búsqueda vectorial acelerada por GPU en Elasticsearch con NVIDIA

Indexación vectorial 12 veces más rápida con GPU de NVIDIA

Búsqueda vectorial a escala masiva: Potenciar Lucene con GPU

Libera el rendimiento de la IA con la búsqueda vectorial acelerada por GPU

Los datos hablan

Base de datos vectorial de Elasticsearch con NVIDIA cuVS: mejor juntos

Acelera tu fábrica de IA

Velocidad de indexación de turbocarga

Maximizar el valor de la infraestructura

Mejorar el rendimiento de las búsquedas

PARA EMPRESARIAL

Lo mejor de Elastic y NVIDIA, optimizado para ti

Abierto y listo para el entorno empresarial

Escala de indexación ilimitada

Escalar Elastic con Kubernetes

Sinergia perfecta entre CPU y GPU