엔비디아 'AI 천문학 파이프라인 사례'… UC산타크루즈 GalaxyFriends 9만 은하 분류·DGX 스테이션·NSF 160만 달러 Lux 클러스터 활용
엔비디아가 UC 산타크루즈(UCSC) 브랜트 로버트슨(Brant Robertson) 교수 연구진이 GPU·AI를 활용해 제임스 웹 우주망원경(JWST) 데이터를 분석하는 파이프라인 사례를 공개했다. JWST는 130억 년 이상 떨어진 빛을 적외선으로 포착하며, 한 장의 딥필드 이미지에 수십만 개 은하가 담긴다.
로버트슨은 "데이터셋이 너무 크고 복잡해 사람이 손으로 분석하기 불가능하다"며 "전문가 팀도 몇 년이 걸리던 작업을 며칠 안에 끝내야 한다"고 말했다. 엔비디아 HPC·AI 하이퍼스케일 인프라 솔루션 시니어 디렉터 디온 해리스(Dion Harris)는 "AI는 과학자들이 우주를 더 빠르게 이해하도록 돕는 동시에 모두가 최첨단 연구에 접근할 수 있게 해준다"고 강조했다.
UCSC 캠퍼스 내 일부 연산은 미국 국립과학재단(NSF) 160만 달러 보조금으로 운영되는 Lux 클러스터에서 처리되고, 더 큰 GPU 작업은 캠퍼스 밖 미 정부 슈퍼컴퓨터로 옮겨 실행된다. 로버트슨의 사무실에는 모델을 대규모로 돌리기 전에 시험할 수 있도록 골드 에디션 NVIDIA DGX 스테이션이 책상 옆에 놓여 있다.
분석 파이프라인의 핵심 도구 중 하나는 모피우스(Morpheus)로, UCSC 출신 라이언 하우젠(Ryan Hausen, 현 존스홉킨스대 리서치 소프트웨어 엔지니어)이 로버트슨과 함께 개발했다. 자율주행에서 도로와 보행자를 구분할 때 쓰는 시맨틱 세그멘테이션 기법에 기반해 픽셀 단위로 은하를 분류하며, JWST 관측에 처음으로 대규모 AI 분석을 적용한 사례다. 이 분석으로 초기 우주에서 회전 원반 은하가 예상보다 일찍 등장한다는 결과가 도출됐고, 이후 여러 차례 독립 검증이 이뤄졌다.
로버트슨 그룹의 대학원생 아나비 우팔(Anavi Uppal)은 'GalaxyFriends'라는 도구를 만들었다. 이 도구는 약 9만 개 은하를 유사성 기반의 '이웃'으로 묶어 일괄 탐색을 가능하게 한다. 로버트슨은 "우주에서 우리가 보지 못했던 구조를 보여주고, 다른 어떤 것과도 닮지 않은 대상이 무엇인지 알려준다"고 말했다.
지상 망원경 데이터 처리에도 AI가 적용된다. 칠레의 베라 C. 루빈 천문대는 가동되면 며칠마다 남반구 전체 하늘을 스캔하며 매일 약 20테라바이트의 원본 데이터를 생성한다. 거울이 너무 커서 우주에 발사할 수 없는 만큼 대기를 통과해 관측해야 해 흐림 현상이 발생하는데, 연구진은 NVIDIA DLSS와 개념이 비슷한 AI 기법으로 이를 보정한다. 우주 관측 데이터로 모델을 학습시킨 뒤 지상 이미지에 적용해 대기 왜곡을 제거하고 세부를 복원하는 방식이다.
관측 외에도 GPU는 우주 시뮬레이션에 활용된다. 로버트슨 그룹은 우주 시간에 따른 가상 우주 부피를 시뮬레이션하고, 이를 망원경 데이터와 비교하며 이론을 검증한다. 그는 "관측이 이론을 만들고, 시뮬레이션이 이론을 시험한다"며 "결과는 다음 관측의 방향을 다듬는다"고 설명했다.
로버트슨 그룹은 약 50만 개 은하 데이터를 일반에 공개했다. NASA 낸시 그레이스 로먼 우주망원경, 제안 단계의 '거주 가능 세계 관측소(Habitable Worlds Observatory)' 등 후속 임무도 줄지어 있어, AI·GPU 기반 처리는 천문학에서 점차 필수 인프라가 되고 있다는 것이 엔비디아의 평가다.