Elastic e Red Hat: escalando a fábrica de IA soberana com aceleração da GPU NVIDIA

Melhore sua fábrica de IA soberana usando o Elastic acelerado com a velocidade das GPUs NVIDIA no cuVS e a flexibilidade do Red Hat AI para viabilizar fluxos de trabalho de RAG e IA agêntica em escala empresarial em qualquer ambiente.

image2_(1).png
Resumo
  • A indexação vetorial da Elastic com NVIDIA cuVS agora está disponível com OpenShift na plataforma Red Hat AI.
  • A integração do Elasticsearch e Red Hat AI com a NVIDIA oferece às organizações uma plataforma abrangente compatível com cargas de trabalho nativas do Kubernetes. 
  • Em conjunto, a busca acelerada por GPU e a computação de alto desempenho permitem implantações RAG seguras e escaláveis em ambientes de nuvem híbrida.

À medida que as soluções em IA generativa superam a fase piloto, as empresas estão de olho na fábrica de IA como infraestrutura padronizada e repetível para executar cargas de trabalho de IA em larga escala. Uma fábrica de IA pronta para produção inclui modelos poderosos, recuperação de conhecimento em tempo real para contexto, raciocínio autônomo e barreiras de proteção que mantêm os dados proprietários seguros.

As organizações precisam dessas soluções em IA para operar no local, na nuvem ou em ambientes híbridos. 

Juntos, Elastic e Red Hat estão tornando isso possível. A busca vetorial acelerada por GPU da Elastic com NVIDIA cuVS já está disponível com OpenShift na plataforma Red Hat AI. Essa colaboração oferece às empresas uma base pronta para uso em produção para implantar busca escalável, retrieval augmented generation (RAG) e agentes de IA inteligentes nos ambientes soberanos. 

Por que a velocidade de Indexação é importante: do RAG à IA agêntica

Implantações bem-sucedidas de IA corporativa recuperam contexto de petabytes de dados proprietários não estruturados da empresa. No núcleo desses pipelines RAG está a busca vetorial. No entanto, à medida que os volumes de dados aumentam, a criação desses índices vetoriais geralmente vira um gargalo que impede as implantações e gera altos custos indiretos.

Ao integrar-se com NVIDIA cuVS para indexação acelerada por GPU, o Elastic descarrega o trabalho computacional intensivo durante a ingestão. Os resultados são substanciais:

  • Indexação até 12 vezes mais rápida 

  • Fusão forçada até 7 vezes mais rápida

  • Menor utilização da CPU

Como banco de dados vetorial recomendado pelo NVIDIA AI Factory Empresarial, o Elastic opera o mecanismo para que agentes autônomos raciocinem e ajam de forma eficaz com os dados mais relevantes. A indexação acelerada significa que seus agentes tomam decisões com base em dados da sua empresa em tempo real e em larga escala.

Red Hat AI é a plataforma ideal para aceleração de GPU Elastic

O Red Hat AI fornece a base nativa do Kubernetes para que as empresas operacionalizem cargas de trabalho de IA, desde os pipelines de recuperação de dados para treinamento de modelos até a inferência. O Elastic, com aceleração da NVIDIA e combinado com a pilha do Red Hat AI, preenche uma lacuna crítica para clientes que priorizam a IA soberana.

Ao usar o Elastic Agent Builder e os fluxos de trabalho do Elastic, os desenvolvedores agora podem criar agentes autônomos na Red Hat AI no OpenShift AI. Esses agentes irão recuperar informações e ativar fluxos de trabalho operacionais em toda a sua nuvem híbrida, mantendo seus dados e modelos dentro do seu ambiente. 

“O Red Hat OpenShift fornece a base essencial, nativa de Kubernetes, para que as empresas operacionalizem e redimensionem as cargas de trabalho de IA em qualquer ambiente de nuvem híbrida”, explica Katie Giglio, diretora sênior de desenvolvimento de ecossistemas da Red Hat. “Ao habilitar a busca acelerada por GPU da Elastic no Red Hat OpenShift e no Red Hat AI com a velocidade da NVIDIA, estamos oferecendo em conjunto uma plataforma aberta e pronta para produção que permite aos clientes criar agentes RAG e de IA autônomos seguros e de alto desempenho, mantendo o controle total sobre a soberania dos dados.”

Implemente em qualquer lugar sem expôr seus dados

A colaboração entre a Elastic e Red Hat com a NVIDIA oferece às organizações, sob rigorosos regulamentos de soberania de dados, a flexibilidade para gerenciar seus dados, independentemente de onde estejam. 

  • O Red Hat AI fornece a base para hospedar e proteger modelos.

  • O Elastic oferece a camada de contexto e um framework para agentes.

  • A infraestrutura de IA da NVIDIA oferece aceleração de desempenho.

  • Clientes integrados podem implantar tranquilamente sistemas de IA agêntica e práticas operacionalizadas de AgentOps

O Elastic com o Red Hat AI garante que dados e modelos comerciais proprietários sejam implantados no ambiente de sua escolha: seu próprio data center, regiões de nuvem ou arquitetura híbrida. 

Elastic e Red Hat AI em ação

Considere uma instituição financeira que enfrenta a complexidade regulatória e os custos de infraestrutura para implantar um assistente de IA voltado para o cliente. Para ser eficaz, esse assistente de IA deve executar como agente capaz de confirmar informações da conta do cliente e sinalizar atividades suspeitas em tempo real. 

Com a busca acelerada por GPU do Elastic na plataforma Red Hat AI, essa organização financeira agora pode: 

  • Indexar novos dados relevantes até 12 vezes mais rápido à medida que os registros de clientes são atualizados

  • Executar agentes autônomos que buscam em milhões de vetores para recuperar o contexto relevante e agir em tempo real 
  • Implantar e redimensionar o pipeline completo de IA em uma única plataforma gerenciada
  • Manter controle total sobre a soberania dos dados e continuar seguro

Comece a usar a Elastic na Red Hat AI

O Elasticsearch com aceleração por GPU já está disponível na plataforma Red Hat AI. Seja para criar sua primeira aplicação RAG ou implantar uma fábrica de IA em escala global, a combinação Elastic, Red Hat e NVIDIA oferece o desempenho e a flexibilidade para soluções modernas de IA em uma base open source.

O lançamento e o tempo de amadurecimento de todos os recursos ou funcionalidades descritos neste artigo permanecem a exclusivo critério da Elastic. Os recursos ou funcionalidades não disponíveis no momento poderão não ser entregues ou não chegarem no prazo previsto.

Neste post do blog, podemos ter usado ou nos referido a ferramentas de IA generativa de terceiros, que pertencem a seus respectivos proprietários e são operadas por eles. A Elastic não tem nenhum controle sobre as ferramentas de terceiros e não temos nenhuma responsabilidade por seu conteúdo, operação ou uso, nem por qualquer perda ou dano que possa surgir do uso de tais ferramentas. Tenha cuidado ao usar ferramentas de IA com informações pessoais, sensíveis ou confidenciais. Os dados que você enviar poderão ser usados para treinamento de IA ou outros fins. Não há garantia de que as informações fornecidas serão mantidas em segurança ou em confidencialidade. Você deve se familiarizar com as práticas de privacidade e os termos de uso de qualquer ferramenta de IA generativa antes de usá-la. 

Elastic, Elasticsearch e marcas associadas são marcas comerciais, logotipos ou marcas registradas da Elasticsearch N.V. nos Estados Unidos e em outros países. Todos os outros nomes de empresas e produtos são marcas comerciais, logotipos ou marcas registradas de seus respectivos proprietários.