목록으로
연구2026년 4월 17일 AM 07:06

OpenAI, 생물학 특화 LLM 'GPT-Rosalind' 공개… 워크플로 50개·공공 DB 접근법 학습

<p>OpenAI가 목요일(현지시간) 일반적인 생물학 연구 워크플로에 특화해 학습시킨 대형 언어 모델(LLM)을 개발했다고 발표했다. 새 모델의 이름은 'GPT-Rosalind'로, DNA 이중나선 구조 규명에 기여한 과학자 로절린드 프랭클린(Rosalind Franklin)에서 따왔다.</p>

<p>OpenAI는 이번 모델이 주요 기술 기업들이 내놓은 과학 특화 모델 상당수와 차별화된다고 설명했다. 기존 모델들은 여러 분야에 두루 적용되는 범용적 접근을 택해온 반면, GPT-Rosalind는 생물학이라는 특정 분야에 맞춘 설계를 택했다.</p>

<p>프레스 브리핑에서 OpenAI 라이프사이언스 제품 총괄인 윤윤 왕(Yunyun Wang)은 GPT-Rosalind가 현재 생물학 연구자들이 마주한 두 가지 주요 장애물을 해결하도록 설계됐다고 밝혔다.</p>

<p>첫 번째 장애물은 수십 년간 축적된 유전체 시퀀싱과 단백질 생화학 연구로 생성된 방대한 데이터셋이다. 단일 연구자가 이 규모를 모두 파악하기에는 너무 방대하다는 지적이다.</p>

<p>두 번째 장애물은 생물학 내부에 극도로 세분화된 여러 하위 분야가 존재하고, 각 분야가 고유한 기법과 전문 용어를 사용한다는 점이다. 왕은 예시로 뇌세포에서 활성화되는 유전자를 다루게 된 유전학자가 방대한 신경생물학 문헌을 이해하는 데 어려움을 겪을 수 있다는 상황을 들었다.</p>

<p>왕은 OpenAI가 기존 LLM을 가져와 가장 일반적인 생물학 워크플로 50개와 더불어 주요 공공 생물학 정보 데이터베이스에 접근하는 방법을 추가로 학습시켰다고 설명했다.</p>

<p>이러한 추가 학습을 거친 결과, GPT-Rosalind는 가능성 있는 생물학적 경로(pathway)를 제시하고 잠재적 약물 표적의 우선순위를 매길 수 있는 시스템이 됐다고 OpenAI는 밝혔다.</p>

<p>왕은 "우리는 알려진 경로와 조절 메커니즘을 통해 유전형(genotype)을 표현형(phenotype)과 연결하고, 단백질의 구조적·기능적 특성을 추정하며, 이러한 메커니즘 기반 이해를 실제로 활용하고 있다"고 말했다.</p>

AI인사이트 편집팀

이 기사는 AI 기술을 활용해 작성되었으며, 편집팀이 검수했습니다.

관련 기사