ComfyUI, 5억 달러 기업가치로 3,000만 달러 조달… 크래프트 벤처스 주도, 노드 기반 디퓨전 제어 도구 사용자 400만 명 돌파
디퓨전 모델의 이미지·비디오·오디오 출력을 노드 기반 워크플로우로 정밀하게 제어하는 스타트업 ComfyUI가 5억 달러 기업가치로 3,000만 달러를 조달했다. 이번 라운드는 크래프트 벤처스(Craft Ventures)가 주도했으며, 페이스 캐피털(Pace Capital), 케미스트리(Chemistry), 트루애로(TruArrow) 등이 참여했다.
ComfyUI는 디퓨전 모델 등장 직후인 2023년 오픈소스 프로젝트로 시작됐다. 당시 미드저니나 OpenAI의 DALL-E 같은 모델은 손에 손가락이 하나 더 생기는 등 큰 결함을 자주 일으키는 등 완성도가 낮은 상태였다. 창립자들은 이런 한계를 해결하기 위해 생성 과정의 모든 단계에 대한 세밀한 제어를 제공하는 모듈형 프레임워크를 개발했다.
이 도구는 크리에이티브 전문가들 사이에서 큰 호응을 얻으며 결국 정식 스타트업으로 발전했다. 2024년 말에는 케미스트리 벤처스(Chemistry Ventures), 커서 캐피털(Cursor Capital), Vercel 창업자 길레르모 라우흐(Guillermo Rauch) 등이 참여한 시리즈 A 라운드에서 1,900만 달러를 조달했다.
공동 창업자이자 CEO인 욜랜드 얀(Yoland Yan)은 테크크런치 인터뷰에서 "미드저니나 ChatGPT 같은 일반적인 프롬프트 기반 솔루션은 원하는 결과의 60~80%까지만 도달한다"며 "나머지 20%를 바꾸려면 슬롯머신을 돌리는 셈"이라고 설명했다. 그는 작은 변경을 요청해도 이미 완성된 부분이 덮어써져 완전히 다른 결과가 나올 수 있어 카지노에 비유했다.
ComfyUI는 노드 기반 인터페이스로 생성 과정의 각 구성요소를 연결해 최종 출력 품질을 완전히 제어할 수 있게 한다고 회사는 강조한다. 현재 사용자는 400만 명 이상으로, 시각효과(VFX)·애니메이션·광고·산업 디자인 등 전문 분야에서 활용되고 있다. 스튜디오 채용 공고에서 'ComfyUI 아티스트' 또는 'ComfyUI 엔지니어'가 직무명으로 등장하는 사례도 적지 않다고 회사는 설명했다.
얀 CEO는 비디오·이미지 파운데이션 모델이 계속 개선되고 있지만 아직 완벽과는 거리가 멀어 ComfyUI 같은 도구의 수요는 지속될 것으로 전망했다. 그는 "AI 슬롭(AI slop)이 도처에 깔리는 세상에서, ComfyUI 방식의 휴먼-인-더-루프(human-in-the-loop) 접근이 결국 시청자 대부분의 눈길을 사로잡을 것"이라고 강조했다. ComfyUI의 경쟁사로는 지난해 Figma에 인수된 스타트업 Weavy가 있다.