디스코드 조사단, 앤스로픽 비공개 보안 AI 'Mythos Preview' 무단 접근… 머코르 침해 데이터·협력사 권한 악용
앤스로픽이 보안 취약점 발굴용 차세대 AI 모델 'Mythos Preview'의 외부 접근을 엄격히 제한해 왔지만, 디스코드(Discord) 기반 아마추어 조사 그룹이 비교적 단순한 방법으로 무단 접근에 성공한 것으로 드러났다. 블룸버그가 처음 보도한 내용으로, AI를 이용한 해킹 없이도 모델이 노출됐다는 점이 주목된다.
와이어드(WIRED) 보도에 따르면 디스코드 사용자들은 AI 트레이닝 스타트업 머코르(Mercor)의 최근 침해 사고에서 유출된 데이터를 분석해 단서를 확보했다. 이들은 "앤스로픽이 다른 모델에 사용해 온 형식에 대한 지식을 토대로 해당 모델의 온라인 위치를 추측했다"고 알려졌으며, 다수의 관찰자들은 이 설명이 웹 URL을 의미한다고 추정했다.
해당 인물은 또한 앤스로픽 협력사에서 일하며 이미 보유하고 있던 권한을 활용해 다른 앤스로픽 모델에 접근한 것으로 전해진다. 이 과정에서 Mythos뿐 아니라 아직 공개되지 않은 다른 앤스로픽 AI 모델들에도 접근했다는 의혹이 제기됐다.
블룸버그에 따르면 다행히도 Mythos에 접근한 그룹은 지금까지 단순한 웹사이트를 만드는 용도로만 모델을 사용한 것으로 나타났다. 이는 앤스로픽이 사용 패턴을 통해 침해를 탐지하지 못하도록 의도적으로 활동을 제한한 결정으로 풀이된다.
Mythos Preview는 소프트웨어와 네트워크의 보안 취약점을 찾아내는 데 "위험할 정도로 뛰어나다"는 평가를 받아온 모델로, 앤스로픽이 출시 범위를 신중히 통제해 온 도구다. 같은 주 모질라(Mozilla)는 Mythos Preview에 조기 접근해 새 파이어폭스 150(Firefox 150) 브라우저 릴리스에서 271개의 취약점을 발견·수정했다고 화요일 발표했다.
이번 사건은 강력한 보안 AI 모델의 통제와 노출 문제를 동시에 보여준다. 합법적 파트너에게는 대규모 취약점 발굴이라는 효용을 제공한 반면, 협력사·외부 침해 사고 데이터 등 우회 경로를 통해 비공개 모델이 외부에 노출될 수 있다는 위험이 현실로 드러난 셈이다.