목록으로
연구2026년 5월 13일 AM 02:35

메타, MySQL 기반 페타바이트 데이터 인그레션 시스템 새 아키텍처로 100% 전환

메타가 자사 소셜그래프 데이터 인그레션 시스템을 새 아키텍처로 100% 이관하고 기존 레거시 시스템을 완전 종료했다고 Meta Engineering 블로그에서 공개했다. 이관 대상은 매일 수 페타바이트 규모의 소셜그래프 데이터를 MySQL에서 데이터웨어하우스로 점진적으로 옮기는 파이프라인이다.

메타의 소셜그래프는 세계 최대 규모 MySQL 배포 중 하나로 운영되며, 여기서 인그레션 시스템이 매일 분석·리포팅·머신러닝 학습·제품 개발에 쓰이는 데이터를 데이터웨어하우스로 옮긴다. 새 아키텍처는 소규모에서는 잘 작동하던 고객 소유 파이프라인 방식을 버리고, 하이퍼스케일에서도 효율적인 자체 관리형 데이터웨어하우스 서비스로 단순화했다.

마이그레이션 라이프사이클은 작업 단위로 정해진 성공 기준을 통과해야 다음 단계로 넘어가도록 설계됐다. 통과 기준은 행 수와 체크섬 비교로 검증한 데이터 품질 일치, 신규 시스템의 데이터 랜딩 지연이 기존 대비 개선 또는 최소한 동등 유지, 컴퓨트·스토리지 사용량이 개선 또는 동등 유지였다. 핵심 테이블에는 의존 팀과 합의한 추가 기준이 더해졌다.

첫 번째 단계는 섀도 페이즈다. 사전 운영 환경에 섀도 작업을 만들어 운영 작업과 동일한 소스를 소비하되 별도 섀도 테이블로 데이터를 내려보내, 운영 데이터와 동작에 노출시키면서도 격리된 곳에서 결과를 점검하고 신속히 수정한다. 운영 작업과 섀도 작업 간 행 수·체크섬 불일치가 발견되면 원인을 추적해 사전 운영에 수정을 배포하고 해결을 확인했다.

두 번째 단계는 리버스 섀도 페이즈다. 섀도 작업의 데이터를 운영 테이블에 쓰고 기존 운영 작업의 데이터를 섀도 테이블에 쓰는 방식으로, 사실상 섀도 작업이 새 운영 작업이 된다. 롤아웃 이후에도 두 시스템 출력을 계속 비교해 데이터 품질 신호를 받을 수 있고, 불일치가 보이면 옛 시스템을 재구성하지 않고도 빠르게 롤백할 수 있다.

세 번째 단계는 마이그레이션 클린업이다. 두 작업의 결과 비교에서 차이가 없으면 옛 시스템에서 도는 섀도 작업을 제거하고, 신규 시스템이 운영 작업으로 데이터 전달을 인계받으면서 마이그레이션이 종료된다.

마이그레이션 전반에 걸쳐 메타는 데이터 품질 분석 도구를 별도로 만들었다. 섀도 테이블 파티션이 내려올 때마다 운영 테이블 파티션의 행 수·체크섬과 비교하고, 불일치를 메타의 실시간 데이터 관리 시스템 Scuba에 기록한다. 매시간 분석 도구가 Scuba 로그를 읽어 불일치를 일으킨 예시 행을 쿼리로 추적해 디버깅 정보를 다시 Scuba로 적재한다. 이 도구는 이관 완료 이후에도 릴리스 검증 절차의 일부로 계속 사용되고 있다.

레거시와 신규 시스템 모두 CDC(체인지 데이터 캡처) 방식으로 타깃 테이블에 점진적으로 데이터를 적재한다. 각 인그레션 작업에는 소스 DB 풀 덤프 내부 테이블, 변경분 델타 내부 테이블, 데이터 소비자가 보는 타깃 테이블이 있고, 테이블 이름과 스키마 등 작업 메타데이터는 중앙 관리 서비스가 보관한다. CDC 특성상 한번 내려간 잘못된 데이터가 이후 적재에 그대로 전파되므로, 메타는 사전 시그널 확보와 빠른 출혈 차단 두 축으로 위험을 줄이는 데 집중했다.

AI인사이트 편집팀

이 기사는 AI 기술을 활용해 작성되었으며, 편집팀이 검수했습니다.

관련 기사