목록으로
제품2026년 6월 3일 AM 07:34

엔비디아·MS, 빌드 행사서 에이전틱 AI 풀스택 파트너십 확대

엔비디아와 마이크로소프트가 마이크로소프트 빌드 행사에서 에이전틱 AI를 위한 통합 스택 파트너십을 확대한다고 발표했다. 젠슨 황 엔비디아 창업자 겸 CEO는 타이베이에서 화상으로 사티아 나델라 마이크로소프트 회장 겸 CEO의 기조연설에 참여해, 윈도우 기기와 애저 클라우드, 로컬 환경 전반에 걸친 협력을 소개했다.

두 회사는 윈도우 PC를 AI 에이전트 시대에 맞게 다시 설계하고 있다. RTX 스파크는 개인용 에이전트를 위해 만들어진 첫 윈도우 PC로, 1페타플롭의 AI 성능과 최대 128GB 통합 메모리, 하루 종일 가는 배터리를 갖췄다. 마이크로소프트 서피스를 비롯해 ASUS, 델, HP, 레노버, MSI에서 올가을 출시된다.

DGX Station for Windows는 윈도우 기업용 애플리케이션과 워크플로우에서 에이전트를 구축·구동하는 데스크사이드 AI 슈퍼컴퓨터다. GB300 그레이스 블랙웰 울트라 데스크톱 슈퍼칩을 기반으로 최대 748GB의 일관 메모리와 20페타플롭의 FP4 성능을 제공하며, 최대 1조 파라미터 규모의 프런티어 모델을 구동한다. ASUS, 델, 기가바이트, HP, MSI, 슈퍼마이크로에서 4분기 출시 예정이며, 두 제품 모두 자율 에이전트를 위한 보안 런타임 NVIDIA OpenShell을 탑재한다.

엔터프라이즈 차원에서는 엔비디아, 앤스로픽, OpenAI 모델과 Hermes 특수 에이전트가 마이크로소프트 파운드리 에이전트 서비스의 호스티드 에이전트로 제공된다. 앤스로픽 클로드 모델은 애저의 엔비디아 GB300 블랙웰 울트라 시스템에서 네이티브로 구동되며 수주 내 고객에게 제공된다. 코딩과 리서치, 기업 워크플로우용 오픈 프런티어 추론 모델인 엔비디아 네모트론 3 울트라는 이달 파운드리 매니지드 컴퓨트에서 제공되고, 음성 인식용 네모트론 3.5 ASR과 네모트론 3.5 콘텐츠 세이프티도 함께 공개된다.

엔비디아의 파운드리 오픈 모델 포트폴리오는 에이전틱·피지컬·과학 AI로 확장된다. 피지컬 AI를 위한 첫 완전 오픈 옴니모델 코스모스 3는 비전 추론과 월드 시뮬레이션, 액션 생성을 제공하며, 어스-2 AI 기상 모델은 마이크로소프트 플래너터리 컴퓨터 프로와 파운드리를 통해 이용할 수 있다. 엔비디아 에이전트 툴킷과 네모클로 블루프린트, cuDF·cuOpt·AI-Q·NeMo 등 CUDA-X 라이브러리도 에이전트의 도메인별 스킬로 제공된다.

데이터 계층도 가속된다. 마이크로소프트 패브릭 데이터 웨어하우스에 엔비디아 가속 컴퓨팅이 내장돼, 마이크로소프트 내부 벤치마크 기준 SQL 실행이 CPU 기반 대비 최대 6배, 고동시성 워크로드에서 다른 주요 클라우드 데이터 웨어하우스 3곳 대비 최대 7배 빨라졌다.

에이전트 개발 보안도 강화됐다. 깃허브 코파일럿에 통합된 NVIDIA OpenShell은 각 에이전트를 격리된 샌드박스 컨테이너에서 실행하고, 모든 외부 호출을 파일·네트워크·자격증명에 도달하기 전 정책에 따라 평가한다. 정책은 코드로 작성돼 저장소에서 버전 관리되며 실시간 업데이트할 수 있다. OpenShell은 아파치 2.0 라이선스의 오픈소스로 모델에 구애받지 않고 온프레미스·하이브리드·클라우드 환경을 아우른다.

마이크로소프트의 페어워터 위스콘신 AI 팩토리는 예정보다 앞서 가동에 들어가, 수십만 대의 엔비디아 그레이스 블랙웰 시스템을 하나의 AI 팩토리로 운영하며 조지아의 유사 팩토리와 연결된다. 전력과 냉각, 엔비디아 스펙트럼-X 이더넷, 새로운 멀티패스 신뢰 연결(MRC) 전송 프로토콜에 대한 공동 엔지니어링으로 토큰 경제성을 최적화했다.

또한 마이크로소프트는 정식 생산에 들어간 엔비디아 베라 루빈 플랫폼을 애저 데이터센터 전반에 배치하도록 검증을 마쳤다. 베라 루빈은 별도 개조 없이 블랙웰 옆에 배치되며, 메가와트당 추론 처리량을 최대 10배 높이고 에이전틱 토큰당 비용을 한 자릿수 차수만큼 낮춘다. 엔비디아 컨피덴셜 컴퓨팅이 대규모 추론 과정에서 모델과 데이터를 보호하고, 엔비디아 다이나모 추론 프레임워크와 그로브가 AKS에서 쿠버네티스 기반 분산 추론 오케스트레이션을 지원한다.

AI인사이트 편집팀

이 기사는 AI 기술을 활용해 작성되었으며, 편집팀이 검수했습니다.

관련 기사