애플 ML 리서치, 조건부 디퓨전 '구성적 일반화' 메커니즘 규명… 'local conditional scores' 등가성 증명·SDXL 특징공간서 정량 입증
애플 머신러닝 리서치팀이 조건부 디퓨전 모델(conditional diffusion model)이 보여 주는 '구성적 일반화(compositional generalization)' 능력의 메커니즘을 규명한 논문 'Local Mechanisms of Compositional Generalization in Conditional Diffusion'을 공개했다. 단독 저자는 아웬 브래들리(Arwen Bradley)이며, 발표 시점은 2025년 10월 9일, 분류된 연구 영역은 'Methods and Algorithms'다.
조건부 디퓨전 모델은 분포 외(out-of-distribution) 조건자(conditioner) 조합에서도 그럴듯한 샘플을 만들어 내는 것처럼 보이지만, 그 작동 원리는 그동안 명확하지 않았다. 연구진은 이를 구체화하기 위해 '길이 일반화(length generalization)' — 즉 학습 시 본 것보다 더 많은 수의 객체를 포함한 이미지를 생성하는 능력 — 를 분석 대상으로 삼았다.
실험은 통제된 CLEVR 환경(Johnson et al., 2017)에서 진행됐다. 그 결과 길이 일반화는 일부 사례에서는 달성됐지만 다른 사례에서는 그렇지 못했으며, 이는 모델이 내재된 구성적 구조를 항상 학습하는 것은 아님을 시사한다는 게 연구진의 평가다.
연구진은 구성적 일반화의 구조적 메커니즘으로 '국소성(locality)'을 지목하고 검증을 시도했다. 선행 연구(Kamb & Ganguli, 2024; Niedoba et al., 2024)는 무조건부 디퓨전 모델의 창의성 메커니즘으로 점수 국소성(score locality)을 제안한 바 있지만, 유연한 컨디셔닝이나 구성적 일반화 자체는 다루지 못했다.
본 논문은 특정 구성 구조인 조건부 사영 구성(conditional projective composition; Bradley et al., 2025)과, 픽셀과 조건자 양쪽에 대해 희소 의존성을 갖는 점수 — 즉 국소 조건부 점수(local conditional scores) — 사이에 정확한 등가성(exact equivalence)이 성립함을 수학적으로 증명했다. 이 이론은 '스타일+콘텐츠' 같은 개념 단위의 구성에도 특징 공간(feature-space)에서 확장 적용된다.
경험적 검증도 따랐다. 길이 일반화에 성공한 CLEVR 모델은 국소 조건부 점수를 실제로 보였지만, 실패한 모델은 그렇지 않았다. 나아가 연구진은 국소 조건부 점수를 명시적으로 강제하는 인과 개입(causal intervention)을 적용해, 그동안 실패하던 모델이 길이 일반화에 성공하도록 만들 수 있음을 보였다.
마지막으로 연구진은 대규모 모델 SDXL을 대상으로 검증했다. 픽셀 공간(pixel-space)에서는 공간적 국소성은 존재했지만 조건부 국소성(conditional-locality)은 대부분 부재했다. 다만 네트워크가 학습한 특징 공간에서는 국소 조건부 점수의 정량적 증거를 발견했다고 보고했다.
이번 연구는 애플 ML 리서치가 같은 흐름에서 함께 공개한 '디퓨전 모델의 사영 구성 메커니즘(Mechanisms of Projective Composition of Diffusion Models, 2025년 5월 1일·ICML)' 작업과 맞닿아 있다. 분포 외 외삽(out-of-distribution extrapolation)과 길이 일반화에 대한 이론적 이해를 보강하려는 일관된 연구 라인의 연장선이다.
관련 기사
애플 ML 리서치, 비디오→스테레오 사운드 생성 'StereoFoley' 공개… 48kHz 객체 인지 오디오·합성 데이터 파이프라인으로 SOTA
엔비디아 Nemotron 3 Nano Omni, AWS SageMaker JumpStart 데이 제로 등록… 30B/3B MoE·131K 컨텍스트로 비디오·오디오·이미지·텍스트 단일 추론
Anthropic Claude Mythos 발표 후 'AI 무장 script kiddie' 경고 확산… DARPA AIxCC서 5,400만 줄 스캔, 비의도 버그 12개+ 발견·Claude Opus 4.7엔 사이버 안전장치 첫 도입