Elastic y Red Hat: escalando la fábrica soberana de IA con aceleración de GPU NVIDIA
Impulsa tu plataforma soberana de IA usando Elastic acelerado con la velocidad de las GPU de NVIDIA en cuVS y la flexibilidad de Red Hat AI para habilitar flujos de trabajo de RAG e IA agéntica a escala empresarial en cualquier entorno.
.png)
Resumen
- La indexación vectorial de Elastic con NVIDIA cuVS ya está disponible con OpenShift en la plataforma Red Hat AI.
- Elasticsearch y Red Hat AI,integrados con NVIDIA,ofrecen a las organizaciones una plataforma integral compatible con las cargas de trabajo nativas de Kubernetes.
- En conjunto, la búsqueda acelerada por GPU y la computación de alto rendimiento permiten despliegues RAG seguros y escalables en entornos de cloud híbrida.
A medida que las soluciones de IA generativa superan la fase piloto, las compañías buscan en la plataforma de IA una infraestructura estandarizada y repetible para ejecutar cargas de trabajo de IA a gran escala. Una plataforma de IA lista para producción incluye modelos poderosos, recuperación de conocimiento en tiempo real para el contexto, razonamiento agente y barreras de seguridad que mantienen seguros los datos propietarios.
Las organizaciones necesitan ejecutar estas soluciones de IA dondequiera que opere su empresa: en un entorno local, en el cloud o en toda una infraestructura híbrida.
Juntos, Elastic y Red Hat lo están haciendo posible. La búsqueda vectorial acelerada por GPU de Elastic con NVIDIA cuVS ya está disponible con OpenShift en la plataforma Red Hat AI. Esta colaboración ofrece a las empresas una base lista para producción que les permite implementar búsqueda escalable, Retrieval-Augmented Generation (RAG) y agentes inteligentes de IA dentro de sus entornos soberanos.
Por qué la velocidad de indexación es importante, desde RAG hasta la IA agéntica
Los exitosos despliegues de IA empresarial recuperan el contexto de petabytes de datos propietarios no estructurados de la empresa. En el núcleo de estos pipelines RAG está la búsqueda vectorial. Sin embargo, a medida que crecen los volúmenes de datos, construir esos índices vectoriales suele convertirse en un cuello de botella que frena los despliegues y genera altos costos generales.
Al integrarse con NVIDIA cuVS para la indexación acelerada por GPU, Elastic delega el trabajo de cálculo intensivo durante la ingesta. Los resultados son contundentes:
Velocidades de indexación hasta 12 veces más rápidas
Hasta 7 veces más rápida en la fusión forzada
Menor utilización de la CPU
Como base de datos vectorial recomendada del diseño validado de NVIDIA Empresarial AI Factory, Elastic impulsa el motor para que los agentes autónomos razonen y actúen eficazmente con los datos más relevantes. La indexación acelerada significa que tus agentes toman decisiones basadas en los datos en tiempo real de tu compañía a escala.
Red Hat AI es la plataforma adecuada para la aceleración de la GPU-Elastic
Red Hat AI ofrece la base nativa de Kubernetes que las empresas necesitan para operar con las cargas de trabajo de IA, desde los pipelines de recuperación de datos para el entrenamiento de modelos hasta la inferencia. Elastic con aceleración de NVIDIA combinado con la pila de Red Hat AI cierra una brecha crítica para los clientes que priorizan la IA soberana.
Con Elastic Agent Builder y Elastic Workflows, los desarrolladores ahora pueden crear agentes autónomos en su entorno de Red Hat AI en OpenShift AI. Estos agentes recuperarán información y activarán flujos de trabajo operativos en todo tu entorno de nube híbrida, mientras mantienen tus datos y modelos dentro del entorno.
“Red Hat OpenShift brinda la base esencial nativa de Kubernetes para que las empresas pongan en funcionamiento y escalen sus cargas de trabajo de IA en cualquier entorno de cloud híbrido”, afirmó Katie Giglio, directora sénior de Desarrollo del Ecosistema, Red Hat. “Al habilitar la búsqueda acelerada por GPU de Elastic en Red Hat OpenShift y Red Hat AI con la velocidad de NVIDIA, estamos entregando conjuntamente una plataforma abierta y lista para producción que permite a los clientes crear agentes de RAG e IA autónomos, seguros y de alto rendimiento, y que, al mismo tiempo, mantengan un control total sobre la soberanía de sus datos”.
Despliega en cualquier lugar, mantén tus datos internamente
La colaboración entre Elastic y Red Hat con NVIDIA brinda a las organizaciones bajo estrictas regulaciones de soberanía de datos la flexibilidad para administrar sus datos sin importar dónde se encuentren.
Red Hat AI ofrece la base para alojar y proteger los modelos.
Elastic brinda la capa de contexto y el marco de trabajo agéntico.
La infraestructura de IA de NVIDIA ofrece la aceleración del rendimiento.
Los clientes combinados pueden desplegar sin problemas sistemas de IA agéntica y prácticas operativas de AgentOps.
Elastic con Red Hat AI garantiza que los datos y modelos empresariales propietarios se desplieguen en el entorno que elijas: tu propio centro de datos, regiones en el cloud o arquitectura híbrida.
Elastic y Red Hat AI en acción
Considera una institución financiera que enfrenta la complejidad regulatoria y los costos de infraestructura de desplegar un asistente de IA orientado al cliente. Para ser eficaz, este asistente de IA debe ejecutarse como un agente capaz de verificar la información de la cuenta del cliente y marcar actividades sospechosas en tiempo real.
Con la búsqueda de Elastic acelerada por GPU en la plataforma de Red Hat AI, esta organización financiera ahora puede:
Indexar nuevos datos relevantes hasta 12 veces más rápido a medida que se actualizan los registros de clientes
- Ejecutar agentes autónomos que buscan en millones de vectores para recuperar el contexto relevante y actuar en tiempo real
- Desplegar y escalar tu pipeline completo de IA dentro de una única plataforma gestionada
- Mantener el control completo sobre la soberanía de los datos y continuar protegido
Comienza con Elastic en Red Hat AI
Elasticsearch con aceleración por GPU ya está disponible en la plataforma Red Hat AI. Tanto si estás creando tu primera aplicación RAG como si estás desplegando una plataforma de IA a escala global, la combinación de Elastic, Red Hat y NVIDIA ofrece el rendimiento y la flexibilidad necesarios para las soluciones de IA modernas sobre una base de open source.
El momento del lanzamiento de cualquiera de las características o funcionalidades descritas en esta publicación queda a exclusivo criterio de Elastic. Es posible que algunas características o funcionalidades que no estén disponibles en este momento no se lancen a tiempo o no se lancen en absoluto.
En esta publicación del blog, es posible que hayamos usado o nos hayamos referido a herramientas de IA generativa de terceros, que son propiedad de sus respectivos propietarios y están gestionadas por ellos. Elastic no tiene ningún control sobre las herramientas de terceros y no tenemos ninguna responsabilidad por su contenido, operación o uso, ni por ninguna pérdida o daño que pueda surgir de tu uso de dichas herramientas. Ten cuidado al usar herramientas de IA con información personal, sensible o confidencial. Cualquier dato que envíes puede usarse para el entrenamiento de IA u otros fines. No se garantiza que la información que proporciones se mantenga segura o confidencial. Debes familiarizarte con las prácticas de privacidad y los términos de uso de cualquier herramienta de IA generativa antes de usarla.
Elastic, Elasticsearch y las marcas asociadas son marcas comerciales, logotipos o marcas comerciales registradas de Elasticsearch N.V. en los Estados Unidos y otros países. Todos los demás nombres de empresas y productos son marcas comerciales, logotipos o marcas comerciales registradas de sus respectivos dueños.