메타, AI 학습 데이터 업체 Mercor와 협력 전면 중단… 대규모 보안 침해 여파
메타(Meta)가 AI 학습 데이터 공급업체 머코(Mercor)의 보안 침해 사건을 이유로 머코와의 모든 협력을 무기한 중단했다. 다른 주요 AI 연구소들도 사건의 영향 범위를 평가하면서 머코와의 업무 관계를 재검토하고 있다.
머코는 OpenAI, 앤스로픽(Anthropic) 등 주요 AI 연구소들이 모델 학습에 사용하는 맞춤형 독점 데이터셋을 생성하는 기업이다. 대규모 인력 네트워크를 활용해 각 연구소에 특화된 학습 데이터를 제작하며, 이 데이터는 ChatGPT와 Claude Code 같은 AI 제품의 핵심 요소인 만큼 극비로 취급된다. AI 연구소들은 이 데이터가 경쟁사에 유출될 경우 모델 학습 방식에 대한 핵심 정보가 노출될 수 있어 민감하게 관리하고 있다.
머코는 3월 31일 직원에게 보낸 이메일에서 보안 사고를 공식 확인했다. 머코 측은 "전 세계 수천 개 조직에 영향을 미친 최근 보안 사고가 자사 시스템에도 영향을 미쳤다"고 밝혔다. 메타 프로젝트에 배정된 계약직 직원들은 프로젝트가 재개될 때까지 근무 시간을 기록할 수 없어 사실상 업무 중단 상태에 놓였다.
메타의 코더스(Chordus) 프로젝트에 관련된 슬랙(Slack) 채널에서 한 프로젝트 리더는 머코가 "현재 프로젝트 범위를 재검토 중"이라고 직원들에게 전달했다. 코더스는 AI 모델이 여러 인터넷 소스를 활용해 사용자 질의에 대한 응답을 검증하도록 학습시키는 메타 전용 프로젝트다.
OpenAI는 머코와의 현재 프로젝트를 중단하지는 않았지만, 자사의 독점 학습 데이터가 어떻게 노출되었는지 조사 중이라고 확인했다. OpenAI 측은 이번 사건이 사용자 데이터에는 영향을 미치지 않는다고 밝혔다. 앤스로픽은 즉각적인 논평 요청에 응하지 않았다.
해킹 그룹 TeamPCP가 AI API 도구 LiteLLM의 2개 버전을 침해한 것이 이번 사건의 기술적 원인으로 지목되고 있다. 이 공격은 LiteLLM을 사용하는 머코를 포함한 수천 개 기업과 서비스에 영향을 미쳤을 수 있다. 한편 잘 알려진 해킹 그룹 Lapsus$를 사칭하는 세력이 텔레그램과 해킹 포럼에서 200GB 이상의 데이터베이스, 약 1TB의 소스코드, 3TB의 영상 및 기타 정보를 판매하겠다고 주장하고 나섰다.
보안 기업 레코디드 퓨처(Recorded Future)의 랜섬웨어 전문 애널리스트 앨런 리스카(Allan Liska)는 "TeamPCP는 확실히 금전적 동기를 가지고 있다"며 "지정학적 요소도 있을 수 있지만 이렇게 새로운 그룹에서 무엇이 진짜이고 무엇이 허세인지 판단하기 어렵다"고 분석했다. 리스카는 유출된 머코 데이터에 대해 "원래의 Lapsus$와 연결되는 것은 전혀 없다"고 덧붙였다.
TeamPCP는 최근 수개월간 소프트웨어 공급망 해킹을 활발히 벌이며 빠르게 두각을 나타내고 있다. 데이터 갈취 공격과 Vect 등 랜섬웨어 그룹과의 협력 외에도, 페르시아어를 기본 언어로 사용하거나 이란 시간대로 설정된 취약한 클라우드 인스턴스를 대상으로 캐니스터웜(CanisterWorm)이라는 데이터 삭제 웜을 유포하는 등 정치적 활동도 감행하고 있다.
머코와 경쟁사인 서지(Surge), 핸드셰이크(Handshake), 튜링(Turing), 레이블박스(Labelbox), 스케일AI(Scale AI) 등은 주요 AI 연구소에 제공하는 서비스에 대해 극도로 비밀스러운 것으로 알려져 있다. 이들 기업의 CEO가 구체적인 업무 내용을 공개적으로 언급하는 경우는 드물며, 내부적으로는 프로젝트에 코드명을 사용한다.