구글 딥마인드, 멀티에이전트 AI 안전 연구에 1천만 달러 지원금 공모
구글 딥마인드가 전 세계 연구자를 대상으로 최대 1천만 달러 규모의 기술 연구 지원금 공모를 발표했다. 슈미트 사이언스, 코오퍼러티브 AI 재단, 첨단연구발명청(ARIA)과 공동으로 진행하며 Google.org의 지원을 받는다.
지난 10년간 딥마인드는 개별 AI 모델을 더 유능하고 도움이 되며 안전하게 만드는 데 집중해 왔다. 그러나 이제 서로 다른 조직이 만든 수백만 개의 AI 에이전트가 디지털 환경에서 소통하고 협상하며 거래하는 새로운 시대로 접어들고 있다고 진단했다.
이런 시스템이 상호작용할 때 안전하고 예측 가능하게 작동해야 한다는 것이 공모의 문제의식이다. 딥마인드는 독립적인 시스템들이 서로 다른 네트워크를 가로질러 상호작용할 때 발생하는 '보이지 않는' 안전 위험을 풀고자 한다고 밝혔다.
대규모 에이전트 집단이 상호작용하면 새로운 집단 행동과 능력이 갑자기 창발할 수 있다. 현재로서는 이런 전환을 예측하고 측정하며 감시할 도구가 없다는 것이 딥마인드의 진단이다. 대부분의 안전 평가가 모델을 고립된 상태로 분석하지만, 상호작용하는 자율 에이전트는 예측하기 어려운 복잡한 창발 행동을 낳을 수 있다.
딥마인드는 이런 변화가 예측 불가능한 경제 활동의 급증을 부르거나 새로운 보안 문제로 이어질 수 있다고 예시했다. 시스템 전반의 행동을 어떻게 관리할지 이해하는 것이 핵심 목표라고 했다.
멀티에이전트 안전 연구의 기초 틀은 이미 존재하지만, 시스템의 빠른 진화에 맞춰 즉각적이고 대규모의 연구 확장이 필요하다고 봤다. 딥마인드는 2025년 연구로 이런 상호작용을 이해하는 틀을 마련했고, 최근 'AI 에이전트 트랩' 연구로 적대적 환경에서 에이전트가 직면하는 취약점을 탐구했다.
이번 공모는 4개 우선 영역의 제안서를 받는다. 첫째는 샌드박스와 테스트베드로, 멀티에이전트 안전 전 분야의 진척을 평가하고 비교하며 가속하기 위한 현실적이고 재현 가능한 환경이다. 가상 시장, 시뮬레이션 생태계, 다조직 워크플로 등이 여기에 포함된다.
둘째는 에이전트 네트워크의 과학으로, 집단 능력이 어떻게 창발하고 확장되는지, 네트워크가 어떻게 붕괴하거나 불안정해지는지, 위험한 집단 수준의 속성을 어떻게 탐지하는지를 다룬다. 셋째는 에이전트 인프라 강화로, 안전한 교차 플랫폼 상호작용을 위한 신원·평판·약속 프로토콜을 스트레스 테스트한다. 넷째는 감독과 통제로, 배포된 에이전트 집단을 감시하고 집단적 피해를 대규모로 완화하는 방법을 개발한다.
이번 노력은 슈미트 사이언스의 '신뢰할 수 있는 AI와 AI 에이전트의 과학' 프로그램, 그리고 ARIA의 '스케일링 트러스트' 프로그램의 사명과도 맞닿아 있다. 딥마인드는 어떤 단일 연구소도 멀티에이전트 안전을 혼자 해결할 수 없다며 학계와 독립 연구자의 제안 참여를 요청했다.
지원 마감은 2026년 8월 8일이며, 선정 결과는 2026년 가을에 발표될 예정이다.