美 정부, 국가안보 이유로 앤스로픽 페이블 5·미토스 5 접근 중단 지시
미국 정부가 국가안보 권한을 근거로 앤스로픽의 AI 모델 '페이블 5(Fable 5)'와 '미토스 5(Mythos 5)'에 대한 모든 접근을 중단하라는 수출 통제 지시를 내렸다. 앤스로픽은 성명을 내고 규정 준수를 위해 모든 고객을 대상으로 두 모델을 즉시 비활성화한다고 밝혔다.
이번 지시는 미국 안팎의 모든 외국 국적자가 두 모델에 접근하는 것을 막는 내용으로, 앤스로픽에 소속된 외국 국적 직원도 대상에 포함된다. 다만 페이블 5와 미토스 5를 제외한 다른 앤스로픽 모델의 이용에는 영향이 없다.
앤스로픽은 현지시간 오후 5시 21분에 정부로부터 지시를 받았으며, 서한에는 구체적인 국가안보 우려 내용이 담겨 있지 않았다고 설명했다. 회사 측은 정부가 페이블 5를 우회하는, 이른바 '탈옥(jailbreak)' 방법을 인지한 것으로 보고 있다고 밝혔다.
앤스로픽은 해당 기법이 시연되는 것을 검토한 결과 이미 알려져 있던 소수의 사소한 취약점을 식별하는 데 쓰였다고 전했다. 이 취약점들은 비교적 단순하며, 공개된 다른 모델들도 우회 기법 없이 같은 취약점을 찾아낼 수 있는 수준이라고 덧붙였다.
회사는 페이블의 안전장치에 대한 입장을 재확인했다. 출시에 앞서 수 주간 미국 정부, 영국 AI안전연구소(UK AISI), 여러 외부 기관, 내부 팀과 함께 수천 시간에 걸쳐 안전장치를 레드팀 테스트했고, 그 결과 페이블의 안전장치가 이전에 배포된 어떤 모델보다 훨씬 효과적인 것으로 나타났다고 밝혔다. 사이버보안 관련 오남용 가능성을 크게 줄이는 안전장치가 지나치게 광범위하다는 이용자 불만이 나올 정도라고도 했다.
다만 앤스로픽은 현재 어떤 모델 제공업체도 완벽한 탈옥 차단은 불가능하다고 본다고 밝혔다. 광범위하게 안전장치를 무력화하는 '보편적 탈옥'은 아직 어떤 테스터도 발견하지 못했지만, 특정 상황에서 일부 정보를 끌어내는 비보편적 탈옥에는 업계의 모든 안전장치가 취약하며 보편적 탈옥도 언젠가 발견될 것이라는 입장이다. 이는 페이블 5 출시 당시에도 분명히 밝힌 내용이라고 강조했다.
이런 이유로 앤스로픽은 페이블 5에 '심층 방어' 전략을 적용했다고 설명했다. 탈옥을 좁은 범위로 묶거나 매우 비싼 비용을 치러야 가능하게 만들고, 철저한 모니터링으로 공격을 빠르게 탐지하고 차단하는 방식이다. 페이블에 고객 데이터 30일 보관 정책을 요구한 것도 탈옥을 연구하고 완화하기 위한 조치라고 밝혔다.
정부가 지금까지 제시한 것은 좁은 범위의 비보편적 탈옥 가능성에 대한 구두 증거뿐이며, 이는 모델에 특정 코드베이스를 읽고 소프트웨어 결함을 고치도록 요청하는 수준이라고 앤스로픽은 밝혔다. 회사는 지시의 근거로 추정되는 보고서를 검토한 결과 거기서 드러난 역량 수준은 오픈AI의 GPT-5.5를 비롯한 다른 모델에서도 널리 제공되며 보안 방어자들이 매일 활용하는 정도라고 확인했다고 전했다. 앞으로 24시간 안에 더 자세한 내용을 공개하겠다고 덧붙였다.
앤스로픽은 정부의 법적 지시를 준수해 모든 이용자의 페이블 5와 미토스 5 접근을 차단하고 있다면서도, 좁은 범위의 탈옥 가능성이 수억 명에게 배포된 상용 모델을 회수할 사유가 되어서는 안 된다고 반박했다. 같은 기준을 업계 전반에 적용하면 모든 프런티어 모델 기업의 신규 모델 배포가 사실상 중단될 것이라고 주장했다.
회사는 정부가 안전하지 않은 배포를 차단할 권한을 가져야 한다는 데는 동의하지만, 그 권한은 투명하고 공정하며 명확하고 기술적 사실에 기반한 법적 절차의 일부여야 한다고 밝혔다. 이번 조치는 그러한 원칙에 부합하지 않는다는 것이다. 앤스로픽은 고객 혼란에 사과하며 이번 사안을 오해로 보고 최대한 빨리 접근을 복구하기 위해 노력하고 있다고 덧붙였다.