생성형 AI를 활용해서 세균을 죽일 수 있는 화합물 설계 가능할까?
인공지능의 도움으로 MIT 연구진이 치료하기 어려운 두 가지 감염을 퇴치할 수 있는 새로운 항생제를 설계했다. 약물 내성 임질균(Neisseria gonorrhoeae)과 다제내성 황색포도알균(MRSA, multi-drug-resistant Staphylococcus aureus)이 그 대상이다.
연구팀은 생성형 AI 알고리즘을 사용해 3,600만 개 이상의 가능한 화합물을 설계하고 항균 특성을 컴퓨터로 선별했다. 발견한 최고 후보물질들은 기존 항생제와 구조적으로 완전히 다르며, 세균 세포막을 파괴하는 새로운 메커니즘으로 작동하는 것으로 보인다.
이 접근법을 통해 연구진은 이전에 본 적 없는 이론적 화합물들을 생성하고 평가할 수 있었다. 이들은 이제 이 전략을 다른 세균 종에 대한 활성을 가진 화합물을 식별하고 설계하는 데 적용하기를 희망하고 있다.
MIT 의학공학과학연구소(IMES)와 생물공학과의 터미어 의학공학과학 교수인 제임스 콜린스는 “이 프로젝트가 항생제 개발을 위해 열어주는 새로운 가능성들에 대해 흥미를 느낀다”며 “우리 연구는 약물 설계 관점에서 AI의 힘을 보여주며, 이전에는 접근할 수 없었던 훨씬 더 큰 화학 공간을 활용할 수 있게 해준다”고 말했다.
콜린스는 오늘 Cell지에 발표된 이 연구의 수석 저자다. 논문의 주저자들은 MIT 박사후연구원 아르티 크리슈난, 전 박사후연구원 멜리스 아나타르(’08), 그리고 재클린 발레리 박사(’23)다.
지난 45년간 FDA가 승인한 새로운 항생제는 수십 개에 불과하며, 이들 대부분은 기존 항생제의 변형이다. 동시에 이러한 약물들에 대한 세균 내성은 계속 증가하고 있다. 전 세계적으로 약물 내성 세균 감염으로 인한 사망자는 연간 거의 500만 명에 달하는 것으로 추정된다.
이 증가하는 문제와 싸울 새로운 항생제를 찾기 위해 콜린스와 MIT의 항생제-AI 프로젝트의 다른 연구자들은 AI의 힘을 활용해 거대한 기존 화학 화합물 라이브러리를 선별해왔다. 이 작업은 할리신(halicin)과 아바우신(abaucin)을 포함한 여러 유망한 약물 후보를 만들어냈다.
이러한 진전을 바탕으로 콜린스와 동료들은 어떤 화학 라이브러리에서도 찾을 수 없는 분자들로 탐색을 확장하기로 결정했다. AI를 사용해 존재하지 않거나 발견되지 않은 가설적으로 가능한 분자들을 생성함으로써, 훨씬 더 다양한 잠재적 약물 화합물을 탐색할 수 있을 것이라고 깨달았다.
새로운 연구에서 연구진은 두 가지 다른 접근법을 사용했다. 첫째, 항균 활성을 보인 특정 화학 조각을 기반으로 분자를 설계하도록 생성형 AI 알고리즘을 지시했고, 둘째, 특정 조각을 포함해야 한다는 제약 없이 알고리즘이 자유롭게 분자를 생성하도록 했다.
조각 기반 접근법에서 연구진은 임질을 일으키는 그람 음성 세균인 임질균을 죽일 수 있는 분자를 식별하고자 했다. 탄소, 질소, 산소, 불소, 염소, 황의 11개 원자의 모든 가능한 조합과 에나민의 쉽게 접근 가능한(REAL) 공간의 조각들로 구성된 약 4,500만 개의 알려진 화학 조각 라이브러리를 구성하는 것부터 시작했다.
그다음 콜린스 연구실이 이전에 임질균에 대한 항균 활성을 예측하도록 훈련시킨 기계학습 모델을 사용해 라이브러리를 선별했다. 이를 통해 거의 400만 개의 조각을 얻었다. 인간 세포에 세포독성이 있을 것으로 예측되거나, 화학적 책임이 나타나거나, 기존 항생제와 유사한 것으로 알려진 조각들을 제거해 풀을 좁혔다. 이를 통해 약 100만 개의 후보가 남았다.
크리슈난은 “기존 항생제와 비슷해 보이는 것은 모두 제거해 항균제 내성 위기를 근본적으로 다른 방식으로 해결하고자 했다”며 “화학 공간의 탐색되지 않은 영역으로 모험을 떠남으로써 새로운 작용 메커니즘을 발견하는 것이 목표였다”고 말했다.
여러 차례의 추가 실험과 컴퓨터 분석을 통해 연구진은 임질균에 대해 유망한 활성을 보이는 것으로 보이는 F1이라고 부른 조각을 식별했다. 두 가지 다른 생성형 AI 알고리즘을 사용해 이 조각을 기반으로 추가 화합물을 생성했다.
화학적으로 합리적인 돌연변이(CReM)로 알려진 알고리즘 중 하나는 F1을 포함하는 특정 분자에서 시작해 원자와 화학 그룹을 추가, 교체 또는 삭제해 새로운 분자를 생성하는 방식으로 작동한다. 두 번째 알고리즘인 F-VAE(조각 기반 변분 자동부호화기)는 화학 조각을 취해 완전한 분자로 구축한다. ChEMBL 데이터베이스의 100만 개 이상 분자에 대한 사전 훈련을 바탕으로 조각이 일반적으로 어떻게 수정되는지의 패턴을 학습해 이를 수행한다.
이 두 알고리즘은 F1을 포함하는 약 700만 개의 후보를 생성했고, 연구진은 이를 임질균에 대한 활성에 대해 컴퓨터로 선별했다. 이 선별을 통해 약 1,000개의 화합물을 얻었고, 연구진은 이 중 80개를 선택해 화학 합성 업체에서 생산할 수 있는지 확인했다. 이 중 단 2개만 합성할 수 있었고, NG1이라고 명명된 그 중 하나는 실험실 접시와 약물 내성 임질 감염 마우스 모델에서 임질균을 죽이는 데 매우 효과적이었다.
추가 실험을 통해 NG1이 세균 외막 합성에 관여하는 새로운 약물 표적인 LptA라는 단백질과 상호작용한다는 것이 밝혀졌다. 이 약물은 막 합성을 방해해 작동하는 것으로 보이며, 이는 세포에 치명적이다.
두 번째 연구에서 연구진은 그람 양성 세균인 황색포도알균을 표적으로 해 생성형 AI를 사용해 자유롭게 분자를 설계하는 잠재력을 탐색했다.
다시 연구진은 CReM과 VAE를 사용해 분자를 생성했지만, 이번에는 원자가 어떻게 결합해 화학적으로 그럴듯한 분자를 형성할 수 있는지에 대한 일반적인 규칙 외에는 제약이 없었다. 두 모델은 함께 2,900만 개 이상의 화합물을 생성했다. 연구진은 임질균 후보에 적용했던 것과 같은 필터를 적용했지만 이번에는 황색포도알균에 초점을 맞춰 결국 풀을 약 90개 화합물로 좁혔다.
이들은 이 분자들 중 22개를 합성하고 테스트할 수 있었고, 그 중 6개가 실험실 접시에서 키운 다제내성 황색포도알균에 대해 강한 항균 활성을 보였다. 또한 DN1이라고 명명된 최고 후보가 마우스 모델에서 메티실린 내성 황색포도알균(MRSA) 피부 감염을 제거할 수 있다는 것도 발견했다. 이 분자들도 세균 세포막을 방해하는 것으로 보이지만, 하나의 특정 단백질과의 상호작용에 국한되지 않는 더 광범위한 효과를 나타낸다.
항생제-AI 프로젝트의 일부이기도 한 비영리 단체인 파레 바이오(Phare Bio)가 현재 NG1과 DN1을 추가 테스트에 적합하도록 더욱 수정하는 작업을 진행하고 있다.
콜린스는 “파레 바이오와의 협력에서 우리는 유사체를 탐색하고 있으며, 의약화학 작업을 통해 최고 후보들을 전임상적으로 발전시키는 작업도 하고 있다”며 “아르티와 팀이 개발한 플랫폼을 다른 관심 세균 병원체, 특히 결핵균과 녹농균에 적용하는 것에 대해서도 흥미를 느낀다”고 말했다.
이 연구는 부분적으로 미국 국방위협감소청, 국립보건원, 오다시어스 프로젝트, 플루 랩, 시 그레이프 재단, 로자문드 잔더와 한스예르그 비스(위스 재단), 그리고 익명의 기부자로부터 자금 지원을 받았다.