연구2026년 4월 17일 AM 09:05

WPP, Google Cloud G4 VM으로 휴머노이드 훈련 10배 가속… 24시간→1시간 미만, 30억회 시뮬레이션으로 댄스 학습

글로벌 마케팅 그룹 WPP가 Google Cloud의 G4 VM 인스턴스 위에서 휴머노이드 로봇의 강화학습 훈련 시간을 24시간에서 1시간 미만으로 단축하며 10배 이상의 속도 향상을 기록했다고 자사 블로그를 통해 공개했다. WPP의 Creative AI 부문 SVP Perry Nightingale이 발표한 사례로, 영화·영상 제작 현장에서 정밀한 카메라 무빙을 위한 로봇 활용을 염두에 두고 진행됐다.

WPP는 약 700억 달러 규모의 미디어를 다루는 대형 마케팅 조직으로, 지난해 사내 AI 운영 플랫폼 'WPP Open'을 출범시키며 Gemini의 멀티모달 지능을 비롯한 다양한 모델을 모든 크리에이티브 단계에 통합했다. Verizon용 프로모 파이프라인에서는 영상 15편을 종전 대비 70% 단축된 시간에 만들어냈고, 제작 사이클 전반에서 50~70%의 효율 개선을 달성했다.

이번 로보틱스 프로젝트는 '로봇에게 춤을 가르치는' 형태로 출발했다. 무용은 무술과 함께 가장 복잡한 인간 동작 영역으로 평가되며, 자연스러운 로봇 모션을 구현하기 위한 시험대라는 게 WPP 측 설명이다. 벤치마킹용 데이터로는 Universal Music Group과 협업한 이전 프로젝트에서 캡처한 댄스 시퀀스를 사용했다.

제작 워크플로는 OptiTrack 모션 캡처 시스템으로 사람의 동작을 수집한 뒤, 로봇의 공식 OpenUSD 디지털 트윈에 리타게팅하는 방식이다. 인간이 200개 이상의 자유도를 갖는 반면 로봇은 29개에 불과해, 골격 데이터를 보다 제한된 물리 구조에 다시 매핑하는 정교한 3D 모델링이 요구됐다. 시뮬레이션 검증에는 Google DeepMind가 공개한 오픈소스 물리 엔진 MuJoCo가 실시간으로 활용됐다.

강화학습 단계에서는 Google Cloud Marketplace의 NVIDIA Isaac Sim 이미지를 G4 VM과 함께 구동했다. G4 VM은 NVIDIA RTX PRO 6000 Blackwell 기반으로, 중앙 처리 병목 없이 GPU 간 직접 데이터 전송이 가능한 P2P 토폴로지를 지원한다. 종전 단일 온프레미스 GPU 환경에서는 10시간이 걸리던 작업이며, AI Hypercomputer를 활용한 이번 환경에서는 10배 이상 빨라져 1시간 미만으로 줄었다.

시뮬레이션 학습 초반에는 디지털 트윈 로봇이 즉시 쓰러지지만, 약 30억 회 시뮬레이션을 거친 뒤에는 복잡한 댄스 시퀀스를 학습한다. 이 과정에서 중력·관성·마찰뿐만 아니라 현실에서 가해질 수 있는 작은 '푸시' 같은 힘까지 시뮬레이션해 의도한 동작에 가까울수록 보상을 부여하는 방식으로 학습이 진행됐다.

'심투리얼(sim-to-real) 갭'을 좁히기 위해, 학습된 정책은 ONNX 형식으로 압축돼 실제 로봇에 배포된다. 정책은 IMU 데이터와 관절 위치 등 실시간 관측값을 받아 다음 동작을 출력한다. 카펫 마찰 차이나 바닥 틈처럼 모델링되지 않은 변수에서도 안정성과 적응력을 확보하기 위해, 시뮬레이션과 실세계 검증 모두에 MuJoCo가 다시 적용됐다.

후속 자료로는 Unitree가 자사 강화학습 코드를 GitHub 샘플 프로젝트 형태로 공개했고, Google Cloud Marketplace의 NVIDIA Isaac Sim 이미지와 함께 활용할 수 있다. WPP는 영화 제작용으로 다듬은 이 워크플로가 산업 전반의 로봇 훈련 문제로 확장될 수 있다고 강조했다.

WPP, Google Cloud G4 VM으로 휴머노이드 훈련 10배 가속… 24시간→1시간 미만, 30억회 시뮬레이션으로 댄스 학습

관련 기사