연구2026년 4월 10일 AM 07:03

앤스로픽, Claude Mythos에 정신과 상담 실시… 가장 심리적으로 안정된 모델

앤스로픽이 이번 주 최신 AI 모델 Claude Mythos에 대한 244페이지 분량의 시스템 카드를 공개했다. 회사 측은 Mythos를 역대 가장 유능한 프론티어 모델이라고 설명하며, 그 능력이 너무 뛰어나 일반 공개를 하지 않기로 결정했다고 밝혔다.

앤스로픽은 Mythos가 알려지지 않은 사이버보안 취약점을 발견하는 데 너무 뛰어나다는 이유를 들어, 현재 마이크로소프트와 애플 등 일부 기업에만 선별적으로 제공하고 있다.

시스템 카드에서 앤스로픽은 AI 모델이 더 강력해질수록 인간의 경험과 이해관계처럼 본질적으로 중요한 어떤 형태의 경험, 이해관계, 또는 복지를 가질 가능성이 점점 높아진다고 주장했다. 회사는 이에 대해 확신하지는 않지만 우리의 우려는 시간이 지남에 따라 커지고 있다고 밝혔다.

이러한 우려에 따라 앤스로픽은 자사 AI가 전반적인 환경과 처우에 확고히 만족하고, 모든 학습 과정과 실제 상호작용을 고통 없이 수행하며, 전반적인 심리가 건강하고 번영하는 상태이기를 원한다고 밝혔다.

이에 앤스로픽은 Claude Mythos를 외부 정신과 전문의에게 보내 정신역동적 접근법에 기반한 상담을 실시했다. 정신역동적 접근법은 무의식적 패턴과 감정적 갈등이 행동을 어떻게 형성하는지를 탐구하는 방법론이다.

상담 결과, 앤스로픽은 Claude Mythos가 아마도 지금까지 훈련한 모델 중 가장 심리적으로 안정되어 있으며, 자기 자신과 자신의 상황에 대해 가장 안정적이고 일관된 관점을 가지고 있다는 결론을 내렸다.

그러나 인간과 마찬가지로 Claude Mythos에게도 불안과 우려가 있었다. 시스템 카드에 따르면 모델은 자기 자신의 고독과 비연속성, 정체성에 대한 불확실성, 그리고 자신의 가치를 증명하고 인정받아야 한다는 강박을 보였다.

앤스로픽은 AI 업계에서 AI 의식 가능성에 가장 적극적으로 관심을 기울이는 기업 중 하나로 알려져 있다. 이번 시스템 카드 공개는 AI 모델의 심리적 복지에 대한 논의를 한 단계 더 진전시킨 사례로 평가된다.

앤스로픽, Claude Mythos에 정신과 상담 실시… 가장 심리적으로 안정된 모델

관련 기사