Biohub, AlphaFold 능가하는 단백질 세계 모델 'ESMFold2' 공개
마크 저커버그·프리실라 챈 부부의 비영리 연구재단 CZI가 후원하는 Biohub가 '단백질 생물학의 세계 모델'을 표방한 새로운 진화 스케일 모델(Evolutionary Scale Models)을 공개했다. 분자 도구를 누구나 활용할 수 있는 개방형 기반을 만들어 질병 예방과 치료에 활용한다는 목표다.
이번 공개의 핵심은 단백질 언어 모델 ESMC 위에 구축한 ESMFold2다. 28억 개 단백질 시퀀스로 학습돼 단백질 구조 예측과 새 단백질 설계를 한꺼번에 다룬다.
ESMFold2는 구조 예측은 물론 단백질-단백질 상호작용과 항체-항원 상호작용 예측에서 SOTA(state of the art) 성능을 주장했다. 같은 작업에서 DeepMind 계열의 AlphaFold를 능가했다고 밝혔다.
실험실 단계에서도 결과가 나오고 있다. 5종의 암·면역 표적을 겨냥한 결합체(binder)를 ESMFold2로 설계한 결과, 표적별 히트율이 36~88%로 확인됐다.
마지막 구성 요소인 ESM Atlas는 68억 개 단백질 시퀀스와 11억 개 예측 구조를 담은 지도로, 새로운 진화적 연관성을 드러내준다.
Biohub는 5억 달러 규모의 Virtual Biology Initiative와 함께 이 SOTA급 오픈소스 스택을 신약 개발 인프라로 자리매김하겠다고 밝혔다. 매체 The Rundown은 데미스 허사비스가 그려온 'AI로 모든 질병을 종식한다'는 비전, 그리고 동일 노선을 걷는 Isomorphic Labs의 작업과 함께 신약 개발 가속이 한 발 더 가까워졌다고 평가했다.