Elastic과 Red Hat: NVIDIA GPU 가속을 통한 주권 AI 팩토리 확장

NVIDIA GPU의 cuVS 가속과 Red Hat AI의 유연성을 갖춘 Elastic으로 주권 AI 팩토리를 강화하여 모든 환경에서 엔터프라이즈 규모의 RAG 및 에이전틱 AI 워크플로우를 구현하세요.

image2_(1).png
요약
  • Elastic의 NVIDIA cuVS를 이용한 벡터 색인화를 이제 Red Hat AI 플랫폼의 OpenShift에서 사용할 수 있습니다.
  • NVIDIA와 통합Elasticsearch 및 Red Hat AI조직에 기본 Kubernetes 워크로드와 호환되는 포괄적인 플랫폼을 제공합니다.
  • GPU 가속 검색과 고성능 컴퓨팅을 함께 사용하면 하이브리드 클라우드 환경 전반에 서안전하고 확장 가능한 RAG 배포가 가능합니다.

생성형 AI 솔루션이 파일럿 단계를 넘어서면서, 기업들은 AI 워크로드를 대규모로 실행하기 위한 표준화되고 반복 가능한 인프라를 위해 AI 팩토리에 주목하고 있습니다. 실제 환경에 투입될 준비를 마친 AI 팩토리는 강력한 모델, 컨텍스트를 위한 실시간 지식 검색, 에이전틱 추론, 기밀 데이터를 안전하게 보호하는 가드레일을 포함합니다.

조직은 온프레미스, 클라우드 또는 하이브리드 환경 등 비즈니스가 운영되는 모든 곳에서 이러한 AI 솔루션을 실행할 수 있어야 합니다. 

Elastic과 Red Hat이 함께 이를 실현하고 있습니다. NVIDIA cuVS로 GPU 가속된 Elastic의 벡터 검색을 이제 Red Hat AI 플랫폼의 OpenShift에서 이용할 수 있습니다. 이 협업 덕분에 기업이 주권 환경 내에서 확장 가능한 검색, 검색 증강 생성(RAG), 지능형 AI 에이전트를 배포할 수 있는 프로덕션 준비 완료 기반을 갖출 수 있게 될 것입니다.

RAG에서 에이전틱 AI까지, 색인 속도가 중요한 이유

성공적인 기업용 AI 구축은 페타바이트 규모의 비정형 기업 기밀 데이터에서 컨텍스트를 추출합니다. 이러한 RAG 파이프라인의 핵심은 벡터 검색입니다. 그러나 데이터 양이 증가하면서 이러한 벡터 색 구축이 배포를 지연시키고 높은 간접 비용을 유발하는 병목 현상을 초래하는 경우가 많습니다.

Elastic은 GPU 가속 색인화를 위해 NVIDIA cuVS를 통합하여 데이터 수집 중에 컴퓨팅 집약적인 작업을 오프로드하며,.그 결과는 놀라울 정도입니다.

  • 최대 12배 빠른 색인 속도 

  • 최대 7배 빠른 강제 병합

  • CPU 사용률 감소

NVIDIA Enterprise AI Factory에서 검증된 설계의 권장 벡터 데이터베이스인 Elastic은 자율 에이전트가 가장 관련성이 높은 데이터로 효과적으로 추론하고 조치를 취할 수 있도록 엔진을 구동합니다. 가속화된 색인은 에이전트가 대규모의 실시간 회사 데이터를 기반으로 의사 결정을 내리고 있음을 의미합니다.

Elastic GPU 가속에 적합한 플랫폼, Red Hat AI

Red Hat AI는 기업이 모델 훈련을 위한 데이터 검색 파이프라인에서 추론에 이르는 AI 워크로드를 운용하는 데 필요한 Kubernetes 네이티브 기반을 제공합니다. Red Hat AI 스택과 결합된 NVIDIA 가속을 갖춘 Elastic은 주권 AI를 우선시하는 고객의 중요한 격차를 해소합니다.

Elastic Agent 빌더와 Elastic 워크플로우를 사용하여 OpenShift AI의 Red Hat AI에서 자율 에이전트를 구축할 수 있습니다. 이 에이전트는 하이브리드 클라우드 전반에서 정보를 검색하고 운영 워크플로우를 트리거하며, 데이터와 모델을 사용자 환경 내에 유지합니다. 

Red Hat의 에코시스템 개발 선임 디렉터 Katie Giglio는 “Red Hat OpenShift는 엔터프라이즈가 하이브리드 클라우드 환경에서 AI 워크로드를 운영화하고 확장하는 데 꼭 필요한 Kubernetes 네이티브 기반을 제공합니다.”라고 말합니다. "Red Hat OpenShift 및 Red Hat AI에서 NVIDIA의 속도로 Elastic의 GPU 가속 검색을 구현함으로써, 고객이 데이터 주권을 완전히 제어하면서 안전하고 성능이 우수한 RAG 및 자율 AI 에이전트를 구축할 수 있도록 지원하는 프로덕션 준비 완료된 개방형 플랫폼을 제공하고 있습니다."

어디서나 배포, 기밀이 유지되는 데이터

Elastic과 Red Hat, NVIDIA의 협력은 엄격한 데이터 주권 규정을 따르는 조직에 데이터가 어디에 있든 유연하게 관리할 수 있는 능력을 제공합니다.

  • Red Hat AI는 모델을 호스팅하고 보호하는 기반을 제공합니다.

  • Elastic은 컨텍스트 레이어와 에이전트 프레임워크를 제공합니다.

  • NVIDIA AI 인프라는 성능 가속을 제공합니다.

  • 통합 고객은 에이전트 기반 AI 시스템과 운영화된 AgentOps 방식을 원활하게 배포할 수 있습니다.

Red Hat AI가 포함된 Elastic은 자체 데이터 센터, 클라우드 리전 또는 하이브리드 아키텍처 등 사용자가 선택한 환경 내에서 기밀 비즈니스 데이터와 모델을 배포할 수 있도록 보장합니다. 

Elastic과 Red Hat AI의 실제 사용

고객 대면 AI 어시스턴트를 배포하는 데 따른 규제 복잡성과 인프라 비용에 직면한 금융 기관을 생각해 보세요. AI 어시스턴트가 효과적으로 실행되려면 고객 계정 정보를 확인하고 의심스러운 활동을 실시간으로 감지할 수 있어야 합니다.

이 금융 기관은 이제 Red Hat AI 플랫폼에서 Elastic GPU 가속 검색을 통해 다음과 같은 기능을 활용할 수 있습니다. 

  • 고객 기록이 업데이트될 때 새로운 관련 데이터를 최대 12배 빠르게 색인

  • 수백만 개의 벡터를 검색하여 관련 컨텍스트를 추출하고 실시간으로 조치를 취하는 자율 에이전트 실행 
  • 단일 관리형 플랫폼 내에서 전체 AI 파이프라인 배포 및 확장
  • 데이터 주권에 대한 완벽한 통제 및 보안 유지

Red Hat AI에서 Elastic 시작하기

GPU 가속이 포함된 Elasticsearch는 현재 Red Hat AI Platform에서 사용할 수 있습니다. 초기 RAG 애플리케이션을 구축하든 글로벌 규모의 AI 팩토리를 배포하든, Elastic, Red Hat, NVIDIA의 조합은 오픈 소스 기반에서 최신 AI 솔루션에 필요한 성능과 유연성을 제공합니다.

이 게시물에서 설명된 모든 기능이나 성능의 출시와 일정은 Elastic의 단독 재량에 따라 결정됩니다. 현재 제공되지 않는 기능이나 성능은 예정된 시간에 출시되지 않을 수도 있으며 아예 제공되지 않을 수도 있습니다.

해당 블로그 게시물에서는 타사 생성형 AI 도구를 사용하거나 언급했을 수 있으며 이러한 도구는 각각의 소유자가 소유하고 운영합니다. Elastic은 이러한 타사 도구에 대한 어떠한 통제권이 없으며 해당 도구의 콘텐츠, 운영, 사용뿐만 아니라 사용으로 인해 발생할 수 있는 손실이나 손해에 대해 어떠한 책임도 지지 않습니다. 개인 정보, 민감한 정보 또는 기밀 정보를 AI 도구와 함께 사용할 때는 주의하시기 바랍니다. 제출된 모든 데이터는 AI 학습이나 기타 목적으로 사용될 수 있습니다. 제공한 정보가 안전하게 보호되거나 비밀로 유지된다는 보장은 없습니다. 생성형 AI 도구를 사용하기 전에 해당 도구의 개인정보 보호 관행과 이용 약관을 숙지하시기 바랍니다. 

Elastic, Elasticsearch 및 관련 마크는 미국 및 기타 국가에서 사용되는 Elasticsearch N.V.의 상표, 로고 또는 등록 상표입니다. 그 외의 모든 회사 및 제품 이름은 해당 소유자의 상표, 로고 또는 등록 상표입니다.