엔비디아(CEO 젠슨 황)가 마이크로소프트(Microsoft)와 협력을 강화한다고 발표했다. 엔비디아(NVIDIA)는 GTC에서 마이크로소프트 애저(Azure), 애저 AI 서비스, 마이크로소프트 패브릭(Fabric), 마이크로소프트 365에 최신 엔비디아 생성형 AI와 옴니버스(Omniverse) 기술을 통합한다고 밝혔다.

마이크로소프트는 자연어 처리, 컴퓨터 비전, 음성 인식 등을 위해 최첨단 조 단위 매개변수 기반 모델을 제공하는 최초의 기업 중 하나이다. 엔비디아 그레이스 블랙웰 GB200과 고급 엔비디아 퀀텀-X800 인피니밴드(Quantum-X800 InfiniBand) 네트워킹의 성능을 애저에 도입할 예정이다.
또한 마이크로소프트는 엔비디아 H100 NVL 플랫폼에 기반한 애저 NC H100 v5 VM(virtual machine)의 정식 출시를 발표했다. NC 시리즈 VM은 미드레인지 훈련과 추론을 위해 설계됐다. 이는 고객들에게 1개에서 2개의 엔비디아 H100 94GB PCIe 텐서 코어(Tensor Core) GPU로 구성된 두 등급의 VM을 제공하며, 엔비디아 멀티 인스턴스 GPU (MIG) 기술을 지원한다. MIG 기술은 각 GPU를 최대 7개 인스턴스(Instance)로 분할할 수 있어 다양한 AI 워크로드를 위한 유연성과 확장성을 제공한다.
마이크로소프트는 클라우드, AI, 슈퍼컴퓨팅 기술의 통합을 통해 의료와 생명 과학 분야를 혁신하기 위해 엔비디아와의 협력을 확대하고 있다. 의료 서비스 제공업체, 제약과 생명 공학 회사, 의료기기 개발사는 마이크로소프트 애저의 강력한 성능을 엔비디아 DGX 클라우드(DGX Cloud)와 엔비디아 클라라(Clara) 마이크로서비스(microservice) 제품군과 함께 활용함으로써 임상 연구와 의료 서비스 제공 전반의 효율성 개선을 개선해 빠른 혁신을 기대할 수 있다.
사노피(Sanofi), MIT와 하버드 대학교가 공동 설립한 브로드 연구소(Broad Institute of MIT and Harvard), 플라이휠(Flywheel), 소피아 제네틱스(SOPHiA GENETICS) 등의 업계 리더, 위스콘신대학교(University of Wisconsin) 의과대학 및 공중보건대학과 같은 학술 의료 센터, 매스 제너럴 브리검(Mass General Brigham) 같은 의료 시스템은 이미 클라우드 컴퓨팅과 AI를 활용해 의료 분야의 변혁을 주도하고 환자에게 제공되는 치료의 질을 개선하고 있다.
엔비디아 옴니버스 클라우드 API(Omniverse Cloud API)는 올해 말 마이크로소프트 애저에서 먼저 제공되며, 개발자들은 기존 소프트웨어 애플리케이션에서 향상된 데이터 상호운용성, 협업, 물리 기반 시각화를 이용할 수 있도록 지원할 예정이다. 이번 엔비디아 GTC에서 마이크로소프트는 애저에서 옴니버스 클라우드 API를 사용해 가능한 성과의 프리뷰를 제공한다. 공장 운영자는 마이크로소프트 파워 BI(Power BI)의 대화형 3D 뷰어를 통해 시설의 3D 디지털 트윈(digital twin)에 올라가는 실시간 공장 데이터를 확인, 생산 속도를 높이는 새로운 인사이트를 얻을 수 있다.
엔비디아 GPU와 엔비디아 트리톤 추론 서버(Triton Inference Server)는 마이크로소프트 365용 마이크로소프트 코파일럿에서 AI 추론 예측을 지원한다. 마이크로소프트 365용 코파일럿은 대규모 언어 모델(LLM)의 성능과 기업 고유의 자체 데이터를 결합해, 상황에 맞는 실시간 인텔리전스(intelligence)를 제공함으로써 사용자의 창의성, 생산성, 역량 향상에 기여한다. 이는 곧 윈도우 11 PC에서 전용 물리적 키보드 키로도 이용 가능하다.
엔비디아 NIM 추론 마이크로서비스는 애저 AI에 도입돼 AI 배포 가속화에 박차를 가한다. 엔비디아 NIM은 엔비디아 AI 엔터프라이즈(Enterprise) 소프트웨어 플랫폼의 일부로, 여기에서 경험 가능한 엔비디아 구축 모델을 포함해 24개 이상의 인기 파운데이션 모델에 최적화된 추론을 위한 클라우드 네이티브 마이크로서비스를 사용자에게 제공한다. 이 마이크로서비스는 배포를 위해 트리톤 추론 서버, 텐서RT(TensorRT), 텐서RT-LLM 등 엔비디아 AI 엔터프라이즈 추론 소프트웨어로 구동되는, 어디서나 실행 가능하며, 사전 구축된 컨테이너를 제공한다. 이를 통해 개발자는 성능에 최적화된 프로덕션 AI 애플리케이션의 출시 기간을 단축할 수 있다. 엔비디아 AI 엔터프라이즈는 애저 마켓플레이스(Marketplace)에서도 이용할 수 있다.