IA empresarial a escala: integración de Elastic y NVIDIA cuVS

Vectoriza datos de alto volumen de forma fluida y acelera tu tiempo de producción con el nuevo estándar de oro para la búsqueda vectorial acelerada por GPU.

Brian Bergholm Rachael Wade Hubert Grzesiek Aleta Hubbell

16 de marzo de 2026

Resumen

Elastic ha colaborado con NVIDIA para lanzar la indexación vectorial acelerada por GPU impulsada por NVIDIA cuVS.
La integración de Elasticsearch en el diseño validado de NVIDIA AI Factory ofrece un modelo probado, completo y prediseñado para acelerar las aplicaciones de IA.
Las empresas pueden vectorizar grandes volúmenes de datos no estructurados hasta 12 veces más rápido que con los métodos basados en CPU.

Las organizaciones están invirtiendo mucho en IA. Pero para generar un valor comercial real, necesitas una infraestructura que no solo pueda almacenar grandes cantidades de datos, sino también buscar y recuperar por contexto rápidamente. Además, necesitas sistemas que puedan razonar, aprender, responder preguntas y tomar medidas, no solo devolver resultados de búsqueda.

La indexación vectorial de Elastic con la aceleración de GPU NVIDIA cuVS elimina una barrera crítica para los despliegues exitosos de IA a escala empresarial, lo que le permite a las organizaciones vectorizar volúmenes masivos de datos no estructurados y ofrecer el contexto preciso y en tiempo real que requieren las soluciones modernas de IA a escala.

Frontera AI

Las empresas están entrando en una nueva fase de adopción de IA, donde la proliferación de datos no estructurados ha hecho que la búsqueda tradicional no sea adecuada para extraer información. Por eso, las empresas están recurriendo a bases de datos vectoriales de alto rendimiento y a la búsqueda semántica para impulsar aplicaciones modernas de IA, como la IA generativa (GenAI), generación aumentada de recuperación (RAG) y los agentes de IA.

Mientras tanto, las organizaciones están creando fábricas de IA para simplificar el despliegue de IA, escalar el rendimiento y maximizar la eficiencia y capacidad de la GPU. La pila integrada que combina computación acelerada con búsquedas vectoriales de alto rendimiento es la más eficiente económicamente para llevar la IA de frontera a tus consumidores y a la empresa.

¿Es posible una IA eficiente?

Cuando las grandes empresas crean plataformas internas de IA generativa que deben indexar y recuperar contexto de petabytes de datos corporativos de manera eficiente, los costos pasan de inmediato a primer plano. Estas fábricas de IA necesitan todas las ventajas posibles para reducir las costosas cargas de trabajo.

De manera similar, las organizaciones que buscan escalar sus capacidades de búsqueda de vectores enfrentan dificultades para hacerlo sin aumentar linealmente su gasto en hardware de CPU. Cuando te propones construir una base de datos vectorial de alto rendimiento, te enfrentas al desafío de construir el índice vectorial (grafo HNSW) en la CPU. Al comparar cada vector, la construcción del índice puede explotar en millones, o incluso miles de millones, de operaciones aritméticas. Y con esa complejidad vienen cuellos de botella en la ingesta. Agrega operaciones del ciclo de vida del índice como la compactación y las fusiones, y tu sobrecarga de cómputo puede aumentar significativamente.

Infraestructura vectorial optimizada para costos

Para ayudarte a superar estos desafíos, Elastic y NVIDIA juntos están habilitando el Elastic AI Ecosystem, redefiniendo cómo las empresas construyen y escalan fábricas de IA al ofrecer búsqueda vectorial acelerada por GPU e infraestructura de IA potente que desbloquea inteligencia de próxima generación en tiempo real.

Al combinar el diseño validado de NVIDIA Enterprise AI Factory con la poderosa base de datos vectorial de Elasticsearch, las organizaciones pueden ofrecer información más detallada y datos relevantes en tiempo real a los agentes de IA y a las aplicaciones GenAI de forma segura y a escala empresarial.

Con Elastic y NVIDIA, obtienes el poder de una base de datos vectorial de alto rendimiento con muchas características y aceleración de GPU, diseñada para la IA moderna.

El cuello de botella en la ingesta basada en CPU se elimina con el aceleramiento de GPU

A continuación se presentan algunos de los beneficios que puedes esperar de esta integración.

Despliegue acelerado

Reduce el tiempo de comercialización a través de un sistema completo y prediseñado para crear fábricas de IA locales. Elasticsearch es una base de datos vectorial validada y compatible con el diseño validado de NVIDIA Empresarial AI Factory, lo que garantiza un marco de trabajo confiable para desplegar aplicaciones de IA autónoma.

Indexación rápida y eficiente

Gestiona de forma más eficiente las incrustaciones vectoriales que crecen exponencialmente y los volúmenes masivos de datos. La integración de NVIDIA cuVS en Elasticsearch ofrece una mejora de casi 12 veces en el rendimiento de indexación y un aumento de 7 veces en la fusión forzada más rápida.

La base de datos vectorial elasticsearch + NVIDIA cuVS cumple

Rentabilidad y optimización de recursos

Al transferir las cargas de trabajo con gran volumen de cálculos a las GPU, se reduce el uso de la CPU y se maximiza el valor de tu infraestructura actual. En una comparación ajustada por costo, la aceleración de GPU frente al uso estándar de CPU ofrece aproximadamente 5 veces más rendimiento de indexación y operaciones de fusión de fuerza 6 veces más rápidas.

Mejora en el rendimiento de las consultas en tiempo real

La búsqueda vectorial acelerada por NVIDIA de Elastic elimina cuellos de botella en el rendimiento, permitiendo que tu infraestructura gestione volúmenes masivos de consultas con tiempos de respuesta casi instantáneos, de modo que puedas escalar aplicaciones de IA generativa y RAG de forma eficiente mientras ofreces información relevante y en tiempo real.

Adaptabilidad y escalabilidad perfectas para el futuro

Mantén una base de datos vectorial de alto rendimiento, probada a escala, sin la carga de una optimización manual constante. NVIDIA cuVS optimiza y acelera las operaciones de búsqueda vectorial a través de las arquitecturas de GPU NVIDIA en evolución y las versiones CUDA para asegurar un rendimiento máximo y una escalabilidad fluida para cargas de trabajo intensivas en IA y datos.

Inferencia nativa acelerada por GPU y gestión de modelos

Elimina la complejidad de gestionar proveedores externos de inferencia e infraestructura. Elastic Inference Service (EIS) proporciona inferencia nativa y de alta capacidad de procesamiento directamente dentro de Elasticsearch mediante la moderna infraestructura de IA de NVIDIA para mantener un rendimiento de baja latencia a escala. Despliega modelos gestionados listos para producción, incluidos los modelos de incrustación y reclasificación multilingües de Jina AI, de forma nativa para garantizar un ajuste preciso de la recuperación y la soberanía de los datos sin una sobrecarga operativa adicional.

¿Qué sigue?

Elastic y NVIDIA colaboraron para ofrecer más velocidad, escala y valor a las empresas que dependen de la búsqueda vectorial para crear y entregar aplicaciones RAG e IA en tiempo real. Tu equipo puede proporcionar rendimiento a escala con menos presión sobre tu infraestructura y tu presupuesto.

Con Elasticsearch incluido en el diseño validado por NVIDIA AI Factory, obtienes un plano prediseñado y probado de pila completa para acelerar aplicaciones de IA, lo que significa más eficiencia y un tiempo de lanzamiento al mercado más rápido.

La integración de NVIDIA cuVS se encuentra actualmente en la versión preliminar técnica para los clientes empresariales de Elastic con gestión propia (versión 9.3). La disponibilidad general está prevista para abril de 2026 con el lanzamiento de la versión 9.4, que ofrecerá una base lista para producción para la búsqueda vectorial de gran volumen y la recuperación de contexto en tiempo real.

Descubre más sobre el creciente ecosistema de Elastic AI, descarga la Guía para desarrolladores del ecosistema de Elastic AI o ponte en contacto con expertos técnicos de Elastic para hablar sobre Elastic AI de alto rendimiento en NVIDIA GTC. Visítanos en el stand n.° 3200, ve demostraciones en tiempo real y conversa con expertos de Elastic.

El momento del lanzamiento de cualquiera de las características o funcionalidades descritas en esta publicación queda a exclusivo criterio de Elastic. Es posible que algunas características o funcionalidades que no estén disponibles en este momento no se lancen a tiempo o no se lancen en absoluto.

En esta publicación del blog, es posible que hayamos usado o nos hayamos referido a herramientas de IA generativa de terceros, que son propiedad de sus respectivos propietarios y están gestionadas por ellos. Elastic no tiene ningún control sobre las herramientas de terceros y no tenemos ninguna responsabilidad por su contenido, operación o uso, ni por ninguna pérdida o daño que pueda surgir de tu uso de dichas herramientas. Ten cuidado al usar herramientas de IA con información personal, sensible o confidencial. Cualquier dato que envíes puede usarse para el entrenamiento de IA u otros fines. No se garantiza que la información que proporciones se mantenga segura o confidencial. Debes familiarizarte con las prácticas de privacidad y los términos de uso de cualquier herramienta de IA generativa antes de usarla.

Elastic, Elasticsearch y las marcas asociadas son marcas comerciales, logotipos o marcas comerciales registradas de Elasticsearch N.V. en los Estados Unidos y otros países. Todos los demás nombres de empresas y productos son marcas comerciales, logotipos o marcas comerciales registradas de sus respectivos dueños.

Ingeniería de contexto

Base de datos vectorial

Aplicaciones basadas en búsqueda

Logs

Protección contra amenazas

Flujos de trabajo

Elasticsearch

Kibana (Discover, dashboards)

Elastic Agent Builder

AutoOps

Lenguaje de búsqueda con barras verticales

Modelos de búsqueda de Jina AI

Elastic Cloud Serverless

Elastic Cloud Hosted

Elasticsearch autogestionado

Búsqueda para comercio electrónico

Búsqueda para atención al cliente

Apps basadas en búsqueda

Analíticas de logs

Monitoreo de infraestructura

Monitoreo de la experiencia digital

Monitoreo del rendimiento de las apps

AIOps

Observabilidad de LLM

SIEM de próxima generación

Flujos de trabajo para seguridad

XDR y seguridad de endpoint

AI aplicada a la seguridad

10 veces el valor de tus datos

Proveedores Cloud

Ecosistema de AI de Elastic

Search AI Partner Program

AV-Comparatives

Forrester Wave™ XDR

Líder en el Magic Quadrant de Gartner

IDC MarketScape

Search

Seguridad

Observabilidad

Comienza

Galería de demostraciones

Descargas

Integraciones

Documentos

Elasticsearch Labs

Elastic Security Labs

Elastic Observability Labs

Blog

Comunidad

Eventos

Webinars

Analiza

Capacitación

Soporte

Consultoría