MS 애저에 엔비디아 그레이스 블랙웰 슈퍼칩 도입…AI 오퍼링 가속화

[아이티데일리] 엔비디아(NVIDIA, CEO 젠슨 황)는 마이크로소프트(MS)와 생성형 인공지능(AI) 협력을 강화한다고 21일 밝혔다.

양사는 MS 애저(Azure), 애저 AI 서비스, MS 패브릭(Fabric), MS 365 등에 최신 엔비디아 생성형 AI와 ‘옴니버스(Omniverse)’ 기술을 통합할 계획이다.

MS 사티아 나델라(Satya Nadella) CEO는 “MS는 엔비디아와 함께 AI의 가능성을 실현해 모든 사람과 조직에 생산성 향상과 새로운 혜택을 제공할 수 있도록 지원하고 있다. 이번 발표 내용에는 MS 애저에 GB200 그레이스 블랙웰(Grace Blackwell) 프로세서를 도입하는 것에서부터 DGX 클라우드와 마이크로소프트 패브릭 간의 새로운 통합까지 포함된다. 이를 통해 고객들은 실리콘에서 소프트웨어(SW)까지 코파일럿(Copilot) 스택의 모든 계층에서 가장 포괄적인 플랫폼과 툴을 통해 자체적으로 혁신적인 AI 기능을 구축할 수 있다”고 밝혔다.

엔비디아 젠슨 황(Jensen Huang) CEO는 “AI는 우리의 일상을 변화시키고 새로운 기회의 세계를 보여주고 있다. MS와의 협력으로 엔비디아는 고객에게 AI의 가능성을 열어주는 미래를 구축해 전 세계에 혁신적인 솔루션을 제공할 수 있도록 돕고 있다”고 말했다.

구체적으로 MS는 엔비디아 그레이스 블랙웰 GB200과 엔비디아 퀀텀-X800 인피니밴드(Quantum-X800 InfiniBand) 네트워킹을 애저에 도입할 예정이다. 또한 엔비디아 H100 NVL 플랫폼에 기반한 애저 NC H100 v5 가상머신(VM)을 정식 출시한다. NC 시리즈 VM은 미드레인지 훈련과 추론을 위해 설계됐다. 이는 고객들에게 1~2개의 엔비디아 H100 94GB PCIe 텐서 코어(Tensor Core) GPU로 구성된 두 등급의 VM을 제공하며, 엔비디아 멀티 인스턴스 GPU (MIG) 기술을 지원한다. MIG 기술은 각 GPU를 최대 7개 인스턴스로 분할할 수 있어 다양한 AI 워크로드를 위한 유연성과 확장성을 제공 가능하다.

특히 엔비디아 옴니버스 클라우드 API(Omniverse Cloud API)는 올해 말 MS 애저에서 먼저 제공될 예정이다. 이외에도 엔비디아는 GPU와 엔비디아 트리톤 추론 서버(Triton Inference Server)를 기반으로 MS 365용 코파일럿에서 AI 추론 예측을 지원한다. MS 365용 코파일럿은 대규모 언어 모델(LLM)의 성능과 기업 고유의 자체 데이터를 결합해 상황에 맞는 실시간 인텔리전스를 제공함으로써 사용자의 생산성과 역량 향상을 돕는다.

아울러 엔비디아 NIM 추론 마이크로서비스가 애저 AI에 도입돼, AI 배포 가속화를 지원하게 된다. 엔비디아 NIM은 엔비디아 AI 엔터프라이즈 SW 플랫폼의 일부로, 엔비디아 구축 모델을 포함해 24개 이상의 인기 파운데이션 모델(FM)에 최적화된 추론을 위한 클라우드 네이티브 마이크로서비스를 사용자에게 제공한다.

해당 서비스 배포를 위해 양사는 트리톤 추론 서버, 텐서RT(TensorRT), 텐서RT-LLM 등 엔비디아 AI 엔터프라이즈 추론 SW로 구동되고 어디서나 실행 가능한 컨테이너를 제공한다. 이를 통해 개발자는 성능에 최적화된 프로덕션 AI 애플리케이션의 출시 기간을 단축할 수 있다. 엔비디아 AI 엔터프라이즈는 애저 마켓플레이스(Marketplace)에서도 이용할 수 있다.

저작권자 © 아이티데일리 무단전재 및 재배포 금지