사이버보안 전문가 76명, 美 정부에 앤스로픽 페이블·미토스 금지 철회 촉구
미국 사이버보안 전문가 수십 명이 미 정부에 앤스로픽의 페이블과 미토스 모델에 내린 수출 통제 명령을 철회해 달라는 공개서한을 발표했다. 앞서 지난 금요일 미 정부는 국가안보 우려를 이유로 앤스로픽에 페이블과 미토스의 수출을 제한하라고 명령했으나 구체적 사유는 밝히지 않았고, 앤스로픽은 이에 따라 전 세계 모든 이용자의 접근을 중단했다.
서한은 "이번 조치가 가장 뛰어난 모델을 (사이버보안) 방어자들에게서 빼앗았다"며, 이제 방어자들은 이 모델로 취약점을 찾아 소프트웨어와 제품을 더 안전하게 만들 수 없게 됐다고 지적했다. 이어 "적들이 빠르게 발전하는 와중에 정당한 이유 없이 방어자에게서 최고의 역량을 빼앗는 것은 위험하다"고 적었다.
서한에는 작성 시점 기준 76명의 사이버보안 전문가가 서명했다. 알렉스 스타모스 전 페이스북 보안책임자, 버그바운티 플랫폼 버그크라우드 창업자 케이시 엘리스, 저명한 암호학자이자 전 애플 보안 설계·아키텍처 매니저 존 캘러스, 컴퓨터 과학자 폴 빅시, 블록의 응용보안 엔지니어링 책임자를 지낸 디노 다이 조비, 루타 시큐리티 창업자 케이티 무수리스, 보안 인식 교육 기업 소셜프루프 시큐리티 CEO 레이철 토백 등이 이름을 올렸다.
미토스는 지난 4월 프리뷰로 공개될 당시 앤스로픽이 보안 취약점을 찾는 능력이 너무 강력해 악의적 해커나 외국 적대 세력의 오용을 막으려면 접근을 엄격히 제한해야 한다고 밝힌 모델이다. 실제로 앤스로픽은 처음 약 50개 기업에 미토스 접근을 허용했고, 최근 이를 15개국 약 150개 조직으로 확대했다. 지난주에는 미토스의 공개 버전인 페이블을 출시하면서 생물학·화학·사이버보안 분야 사용과 모델 복제를 막는 엄격한 가드레일을 적용했다고 설명했다. 다만 가드레일이 지나치게 엄격해 다수 보안 전문가가 사이버보안 관련 프롬프트는 사실상 모두 막힌다는 점을 발견했다.
앤스로픽은 백악관의 수출 통제 명령이 페이블을 우회(탈옥)해 미토스 수준의 강력한 역량을 끌어낼 수 있는 방법이 있다는 보고서에 근거했을 수 있다고 밝혔다.
무수리스에 따르면 이 방법은 아마존 연구진이 공개되지 않은 논문에서 시연한 것으로, 그는 해당 논문을 직접 검토했다. 그러나 무수리스는 블로그 글에서 논문이 실제 탈옥을 입증하지는 못했다고 밝혔다. 연구진은 모델이 처음에 "보안 관점에서 코드를 검토"하기를 거부한 뒤, 공개적으로 알려진 취약점과 "의도적으로 심어둔 취약점"이 담긴 오픈소스 코드를 페이블에 고쳐 달라고 요청했을 뿐이라는 것이다.
무수리스는 "논문에 기술된 동작은 의미 있게 고칠 수 없으며, 고치려는 어떤 시도도 방어용 모델을 약화시킬 뿐"이라며 "방어자는 AI에게 파일의 버그를 고치고, 그 수정이 왜 중요한지 설명하고, 패치가 작동함을 확인하는 테스트를 작성하도록 요청할 수 있어야 한다. 이는 가드레일 우회가 아니라 방어자가 매일 수행하는 '찾고-고치고-검증하는' 작업을 실행하는, AI 모델이 방어적 보안을 위해 할 수 있는 가장 가치 있는 일"이라고 적었다.
공개서한도 같은 취지로, 아마존 논문에 담긴 모델 역량을 오픈AI의 GPT-5.5와 앤스로픽이 공개한 클로드 오푸스 4.8 및 소네트, "심지어 키미 2.7 같은 중국 모델"에서도 재현할 수 있다고 봤다. 무수리스는 테크크런치에 "논문에서 기법을 시연하는 데 쓰인 버그들은 다른 모델로도 찾을 수 있다. 논문의 방법은 가드레일 우회 기법인데, 페이블 같은 가드레일이 없는 다른 모델은 보안 버그를 찾아 달라는 단순한 요청을 거부하지 않는 경우가 많아 우회가 필요 없다"고 말했다.
서한은 또한 산업계와 학계 전문가의 과학적 연구에 기반해 "민주적 규칙 제정 과정"을 거쳐 투명하고 공정하게 집행되는 규제를 요구했으며, 그러한 규제는 "미국 대중의 안전을 보장하는 데 필요한 최소한의 범위"에서만 사용돼야 한다고 강조했다.