구글 클라우드·딥마인드, 미국 동계올림픽 선수를 위한 AI 포즈 추정 시스템 구축
구글 클라우드가 구글 딥마인드(Google DeepMind)와 협력하여 미국 동계올림픽 선수들을 위한 AI 기반 3D 생체역학 분석 시스템을 구축했다. 이 시스템은 단일 2D 영상을 63개 관절의 완전한 3D 생체역학 분석으로 변환하며, 선수와 코치에게 혁신적인 경쟁 우위를 제공한다.
프리스키와 스노보드 같은 종목에서 기존 영상 리플레이는 공중 기술의 물리적 원리를 설명하지 못한다. 관절 각도, 회전 속도, 신체 압축 등의 데이터를 프레임 단위로 추적·분석하려면 선수의 전체 3D 모델이 필요하다. 이 시스템의 AI 포즈 추정 모델이 바로 이 역할을 수행한다.
가장 큰 기술적 난제는 극한 조건에서의 컴퓨터 비전이다. 스노보더와 스키 선수는 극단적인 속도로 움직이며, 두꺼운 장비를 착용하고, 그랩이나 스핀 동작 시 팔다리가 시야에서 사라진다. 일반적인 포즈 추정 모델은 이러한 가림(occlusion)이 발생하면 추적을 잃는다.
이를 해결하기 위해 독자적인 인체 운동 모델을 개발했다. 각 프레임을 개별적으로 처리하는 대신, 학습된 사전 지식을 활용해 신체의 전체 궤적을 기반으로 가려진 관절의 위치를 추론한다. 이 시간적 추론(temporal reasoning) 방식은 빠른 역회전 동작 중에도 안정적인 디지털 골격을 유지한다.
인프라의 핵심에는 구글의 TPU(Tensor Processing Unit)가 있다. 인코더가 영상을 잠재 표현으로 압축한 후, 비디오 트랜스포머 모델이 3D 관절 위치를 예측한다. 클라우드의 일반적인 콜드 스타트 지연을 제거하기 위해, 대회 기간 동안 전용 TPU 슬라이스를 정적으로 프로비저닝하여 모델을 고대역폭 메모리(HBM)에 상시 로드해 두었다.
Vertex AI는 대규모 오케스트레이션을 담당한다. Vertex AI Batch Prediction API를 통해 수신 영상을 분산 워커 네트워크로 즉시 전달하고, 여러 선수의 영상을 동시에 처리한다. 선수 경기 중 갑자기 급증하는 연산 수요에 대응해 동적으로 리소스를 프로비저닝한다.
보안을 위해 가상 사설 클라우드(VPC) 내에 프라이빗 엔드포인트를 구축하여, 승인된 트래픽만 전용 네트워크 경로를 통해 전달되도록 했다. 이를 통해 미국 팀의 독점적 데이터를 공용 인터넷으로부터 격리하고 공격 표면과 지연 시간을 최소화했다.
구글 클라우드 팀은 이 시스템이 스포츠를 넘어 다양한 분야로 확장될 수 있다고 밝혔다. 대화형 AI 물리치료 코치가 환자의 움직임 자세를 분석하거나, 공장 작업자의 자세를 감지해 로봇이 보조하는 등의 활용 사례를 제시했다.