Elastic et Red Hat : scaling d'usine d'IA souveraine avec l'accélération GPU de NVIDIA
Optimisez votre usine d'IA souveraine avec Elastic grâce à l'accélération par GPU NVIDIA sur cuVS et à la flexibilité de Red Hat AI pour déployer des workflows de RAG et d'IA agentique à l'échelle de l'entreprise dans tous les environnements.
.png)
Résumé
- L'indexation de vecteurs d'Elastic avec NVIDIA cuVS est maintenant disponible avec OpenShift sur la plateforme Red Hat AI.
- Elasticsearch et Red Hat AI intégrés à NVIDIA offrent aux organisations une plateforme complète compatible avec les charges de travail Kubernetes natives.
- Ensemble, la recherche accélérée par GPU et le calcul haute performance permettent des déploiements RAG sécurisés et scalables dans les environnements cloud hybrides.
À mesure que les solutions d'IA générative dépassent la phase pilote, les entreprises se tournent vers les usines d'IA pour disposer d'une infrastructure standardisée et reproductible permettant d'exécuter des charges de travail d'IA à grande échelle. Une usine d'IA prête pour la production comprend des modèles performants, la récupération de connaissances en temps réel pour le contexte, le raisonnement agentique et des garde-fous garantissant la sécurité des données propriétaires.
Les organisations ont besoin de ces solutions d'IA pour fonctionner partout où leur entreprise opère : sur site, dans le cloud ou dans un environnement hybride.
Ensemble, Elastic et Red Hat rendent cela possible. La recherche vectorielle accélérée par GPU d'Elastic avec NVIDIA cuVS est maintenant disponible avec OpenShift sur la plateforme Red Hat AI. Cette collaboration dote les entreprises d'une base prête pour la production afin de déployer des solutions de recherche scalable, de génération augmentée par récupération (RAG) et d'agents d'IA intelligents au sein de leurs environnements souverains.
Pourquoi la vitesse d'indexation, de la RAG à l'IA agentique, est importante
Les déploiements d'IA réussis en entreprise exploitent le contexte issu de pétaoctets de données propriétaires non structurées. La recherche vectorielle est au cœur de ces pipelines RAG. Cependant, à mesure que les volumes de données augmentent, la création de ces index vectoriels devient souvent un goulot d'étranglement qui ralentit les déploiements et engendre des coûts d'exploitation élevés.
En s'intégrant à NVIDIA cuVS pour l'indexation accélérée par GPU, Elastic décharge les tâches de calcul intensives lors de l'ingestion. Les résultats obtenus sont substantiels :
Des vitesses d’indexation jusqu’à 12 fois plus rapides
Jusqu'à 7 fois plus rapide pour la fusion forcée
Utilisation réduite du processeur
En tant que base vectorielle recommandée par la conception validée de NVIDIA Entreprise IA Factory, Elastic alimente le moteur permettant aux agents autonomes de raisonner et d'agir efficacement à partir des données les plus pertinentes. L'indexation accélérée garantit que vos agents prennent des décisions fondées sur les données de votre entreprise en temps réel et à grande échelle.
Red Hat AI est la plateforme idéale pour l'accélération par GPU d'Elastic
Red Hat AI fournit aux entreprises la plateforme Kubernetes native dont elles ont besoin pour déployer des charges de travail d'IA, de la récupération des données à l'entraînement et à l'inférence des modèles. L'intégration d'Elastic avec l'accélération NVIDIA à la suite Red Hat AI comble une lacune critique pour les clients qui optent pour une IA souveraine.
Grâce à Elastic Agent Builder et Elastic Workflows, les développeurs peuvent désormais créer des agents autonomes dans leur environnement Red Hat AI sur OpenShift AI. Ces agents collectent des informations et déclenchent des workflows opérationnels au sein de votre cloud hybride, tout en préservant vos données et vos modèles dans votre environnement.
"Red Hat OpenShift fournit aux entreprises une infrastructure Kubernetes native essentielle pour déployer et scaler leurs charges de travail d'IA dans n'importe quel environnement de cloud hybride", a déclaré Katie Giglio, directrice principale du développement de l'écosystème chez Red Hat. "En intégrant la recherche accélérée par GPU d'Elastic à Red Hat OpenShift et Red Hat AI avec la vitesse de NVIDIA, nous proposons conjointement une plateforme ouverte et prête pour la production qui permet aux clients de créer des agents RAG et des agents d'IA autonomes sécurisés et hautement performants, tout en conservant un contrôle total sur la souveraineté de leurs données."
Déployez où vous voulez, conservez vos données en interne
La collaboration entre Elastic et Red Hat avec NVIDIA offre aux organisations soumises à des réglementations strictes en matière de souveraineté des données la flexibilité nécessaire pour gérer leurs données, quel que soit leur emplacement.
Red Hat AI fournit la base pour héberger et sécuriser les modèles.
Elastic fournit la couche de contexte et le framework agentique.
L'infrastructure IA de NVIDIA assure l'accélération des performances.
Cette association permet aux clients de déployer sans difficulté des systèmes d'IA agentique et des pratiques AgentOps opérationnalisées.
Elastic avec Red Hat AI garantit que les données et les modèles métier propriétaires sont déployés dans l'environnement de votre choix : votre propre centre de données, des régions cloud ou une architecture hybride.
Elastic et Red Hat AI en action
Prenons l'exemple d'un établissement financier confronté à la complexité réglementaire et aux coûts d'infrastructure liés au déploiement d'un assistant d'IA destiné aux clients. Pour être efficace, cet assistant d'IA doit fonctionner comme un agent capable de vérifier les informations des comptes clients et de signaler les activités suspectes en temps réel.
Grâce à la recherche accélérée par GPU d'Elastic sur la plateforme Red Hat AI, cet établissement financier peut désormais :
Indexez les nouvelles données pertinentes jusqu'à 12 fois plus vite à mesure que les dossiers clients sont mis à jour
- Exécuter des agents autonomes qui recherchent parmi des millions de vecteurs afin de récupérer un contexte pertinent et d'agir en temps réel
- Déployer et scaler son pipeline d'IA complet au sein d'une plateforme gérée unique
- Conserver un contrôle total sur la souveraineté des données et rester en sécurité
Commencez avec Elastic sur Red Hat IA
Elasticsearch avec accélération par GPU est disponible dès aujourd'hui sur la plateforme Red Hat AI. Que vous développiez votre première application RAG ou que vous déployiez une usine d'IA à l'échelle mondiale, l'association d'Elastic, de Red Hat et de NVIDIA offre les performances et la flexibilité nécessaires aux solutions d'IA modernes sur une base open source.
La publication et la date de publication de toute fonctionnalité ou fonction décrite dans le présent article restent à la seule discrétion d'Elastic. Toute fonctionnalité ou fonction qui n'est actuellement pas disponible peut ne pas être livrée à temps ou ne pas être livrée du tout.
Dans cet article, nous sommes susceptibles d'avoir utilisé ou mentionné des outils d'IA générative tiers appartenant à leurs propriétaires respectifs qui en assurent le fonctionnement. Elastic n'a aucun contrôle sur les outils tiers et n'est en aucun cas responsable de leur contenu, de leur fonctionnement, de leur utilisation, ni de toute perte ou de tout dommage susceptible de survenir à cause de l'utilisation de tels outils. Veuillez faire preuve de prudence lorsque vous utilisez des outils d'IA avec des informations personnelles, sensibles ou confidentielles. Toute donnée que vous soumettez peut être utilisée pour entrainer l'IA ou à d'autres fins. Vous n'avez aucune garantie que la sécurisation ou la confidentialité des informations renseignées sera assurée. Vous devriez vous familiariser avec les pratiques en matière de protection des données personnelles et les conditions d'utilisation de tout outil d'intelligence artificielle générative avant de l'utiliser.
Elastic, Elasticsearch et les marques associées sont des marques commerciales, des logos ou des marques déposées d'Elasticsearch N.V. aux États-Unis et dans d'autres pays. Tous les autres noms de produits et d'entreprises sont des marques commerciales, des logos ou des marques déposées appartenant à leurs propriétaires respectifs.