엔비디아(CEO 젠슨 황)가 전 세계 고객들에게 소버린 AI(sovereign AI) 솔루션을 제공하기 위해 오라클(Oracle)과의 협력을 확대한다고 발표했다.
오라클의 분산형 클라우드, AI 인프라, 생성형 AI 서비스는 엔비디아의 가속 컴퓨팅과 생성형 AI 소프트웨어와 결합해 정부와 기업이 AI 팩토리를 구축할 수 있도록 지원한다.
이러한 AI 팩토리는 다양한 운영 제어를 통해 국가 또는 조직의 안전한 시설에서 클라우드 서비스를 로컬로 실행할 수 있으며, 경제 성장을 다각화하고 촉진하려는 국가 목표를 지원한다.
엔비디아 풀스택 AI 플랫폼은 오라클 엔터프라이즈 AI와 결합해 고객에게 운영, 위치, 보안에 대한 제어력을 강화해 디지털 주권을 지원하는 최첨단 AI 솔루션을 제공한다. 오라클 엔터프라이즈 AI는 OCI 전용 리전(OCI Dedicated Region), 오라클 알로이(Oracle Alloy), 오라클 EU 소버린 클라우드(Oracle EU Sovereign Cloud), 오라클 정부 클라우드(Oracle Government Cloud)에 배포 가능하다.
전 세계 국가들은 자국의 문화적, 경제적 목표 달성에 도움이 될 AI 인프라에 투자를 늘리고 있다. 26개국 66개 클라우드 리전에서 고객들은 인프라와 애플리케이션을 아우르는 100개 이상의 클라우드와 AI 서비스에 액세스해 IT 마이그레이션, 현대화, 혁신을 달성할 수 있다.
양사의 통합 솔루션은 퍼블릭 클라우드 또는 특정 위치의 고객 데이터센터에 유연한 운영 제어를 통해 배포할 수 있다. 오라클은 어디서나 로컬로 AI와 전체 클라우드 서비스를 제공할 수 있는 유일한 하이퍼스케일러(Hyperscaler)이다. 배포 유형에 관계없이 일관적인 오라클 서비스와 가격은 계획, 이동성, 관리를 간소화한다.
오라클 클라우드 서비스는 엔비디아 가속 컴퓨팅 인프라와 엔비디아 AI 엔터프라이즈 소프트웨어 플랫폼을 비롯한 다양한 엔비디아 스택을 활용한다. 또한, 새로 발표된 엔비디아 NIM 추론 마이크로서비스는 엔비디아 텐서RT(TensorRT), 엔비디아 텐서RT-LLM, 엔비디아 트리톤 추론 서버(Triton Inference Server)와 같은 엔비디아 추론 소프트웨어를 기반으로 구축된다.
자산 관리 기술 분야의 선두주자인 아발로크(Avaloq)는 자체 데이터센터에 완전한 OCI 클라우드 리전을 운용하기 위해 OCI 전용 리전을 선택했다.
뉴질랜드의 선도적인 정보관리서비스 제공업체인 팀 아이엠(TEAM IM)은 뉴질랜드 최초의 현지에서 소유하고 운영되는 하이퍼스케일 클라우드인 팀 클라우드(TEAM Cloud)를 구축하기 위해 오라클 알로이를 선택했다.
이앤(e&) 그룹의 통신 계열사인 이앤UAE(e& UAE)는 AI 역량을 강화하기 위해 오라클과 협력하고 있다. 이들은 OCI 전용 리전 내에 엔비디아 H100 텐서 코어(Core) GPU 클러스터를 구축할 계획이다.
오라클은 고객들이 지속적으로 증가하는 AI 모델에 대한 요구사항을 충족할 수 있도록 GTC에서 발표된 최신 엔비디아 그레이스 블랙웰 컴퓨팅 플랫폼을 OCI 슈퍼클러스터와 OCI 컴퓨트에 활용할 계획이다. OCI 슈퍼클러스터는 새로운 OCI 컴퓨트 베어 메탈 인스턴스, 초저지연 RDMA 네트워킹, 고성능 스토리지를 통해 훨씬 더 빨라질 것이다. OCI 컴퓨트에는 엔비디아 GB200 그레이스 블랙웰 슈퍼칩과 엔비디아 블랙웰 B200 텐서 코어 GPU가 모두 탑재될 예정이다.
엔비디아 GB200 그레이스 블랙웰 슈퍼칩은 컴퓨팅의 새로운 시대를 열 것이다. GB200은 이전 세대의 GPU에 비해 최대 30배 빠른 실시간 대규모 언어 모델(LLM) 추론, 25배 낮은 TCO(총소유비용), 25배 적은 에너지를 제공해 AI 훈련, 데이터 처리, 엔지니어링 설계, 시뮬레이션 등을 대폭 강화한다. 엔비디아 블랙웰 B200 텐서 코어 GPU는 고난이도 AI, 데이터 분석, HPC(고성능 컴퓨팅) 워크로드를 위해 설계됐다.
또한 검색 증강 생성(RAG) 추론 배포를 위한 엔비디아 네모 리트리버(NeMo Retriever)를 포함한 엔비디아 NIM과 쿠다-X(CUDA-X) 마이크로서비스도 활용된다. 이는 OCI 고객들이 자체 데이터를 사용해 생성형 AI 코파일럿과 기타 생산성 도구에 더 많은 인사이트와 정확성을 제공하는 데 도움이 될 것이다.
점점 더 복잡해지는 AI 모델에 대한 고객 수요 증가에 부응하기 위해, 양사는 엔비디아 DGX 클라우드 온 OCI에 엔비디아 그레이스 블랙웰을 추가한다. 고객들은 조 단위 매개변수 LLM 시대에 에너지 효율적인 훈련과 추론을 위해 설계된 이 공동 엔지니어링 슈퍼컴퓨팅 서비스를 통해 새로운 GB200 NVL72 기반 인스턴스에 액세스할 수 있다.
전체 DGX 클라우드 클러스터 구축에는 20,000개 이상의 GB200 가속기와 엔비디아 CX8 인피니밴드(Infiniband) 네트워킹이 포함돼 확장성과 성능이 뛰어난 클라우드 인프라를 제공할 것이다. 이 클러스터는 5세대 NV링크(NVLink)가 탑재된 72개의 블랙웰 GPU NVL72와 36개의 그레이스 CPU로 구성된다.