AI 인퍼런스 스타트업 Parasail, 3,200만 달러 시리즈A 투자 유치… 하루 5,000억 토큰 처리
AI 모델 인퍼런스 전문 클라우드 컴퓨팅 스타트업 Parasail이 3,200만 달러 규모의 시리즈A 투자를 유치했다. Touring Capital의 사미르 쿠마르(Samir Kumar)와 Kindred Ventures의 스티브 장(Steve Jang)이 공동으로 라운드를 이끌었다.
Parasail CEO 마이크 헨리(Mike Henry)는 LLM 전용 칩 제조사 Groq에서 클라우드 서비스를 구축한 경험을 가지고 있다. 1년 전 스텔스에서 벗어난 Parasail은 현재 하루 5,000억 개의 토큰을 생성하고 있다.
Parasail은 자체 칩 보유에 집착하지 않는 전략을 취한다. 일부 GPU는 자사 소유지만, 주로 15개국 40개 데이터센터에서 처리 시간을 임대하고 유동성 시장에서 추가 구매하며, 이를 뒤에서 조율해 인퍼런스 요청 비용을 낮추는 방식이다.
워크로드를 효율적으로 배분하고 수요 피크를 회피함으로써, 자체 실리콘을 보유하면서도 기존 고객 약속에 제약받는 경쟁사들과 차별화한다. 인퍼런스 전용(훈련 불가) 정책과 장기 계약 없이 스타트업 고객을 받아들이는 점이 대형 클라우드 기업 및 Fireworks AI, Baseten 같은 경쟁사와의 차이점이다.
이 회사의 성장 잠재력은 프론티어 연구소 밖에서의 오픈소스 모델과 에이전트 확산에 달려 있다. Parasail 경영진과 투자자들은 앤스로픽, OpenAI 같은 기업의 서비스 이용 비용과 마찰이 커지면서 이런 추세가 가속화되고 있다고 본다.
과학 문헌 연구 보조 스타트업 Elicit의 CEO 안드레아스 슈툴뮐러(Andreas Stuhlmüller)는 대형 제약사 고객들이 수만 건의 논문을 분석하는 과정에서 오픈소스 모델로 전환했다고 밝혔다. 초기 스크리닝에 오픈 모델을 활용해 비용을 낮추고, 최종 답변에만 프론티어 모델을 투입하는 하이브리드 아키텍처가 부상하고 있다.
Touring Capital의 사미르 쿠마르는 인퍼런스가 향후 소프트웨어 구축 비용의 최소 20%를 차지할 것으로 전망했다. 에이전트가 소프트웨어 개발의 점점 더 일반적인 부분이 되면서 모델 쿼리가 폭발적으로 늘어나고 있기 때문이다.
Kindred Ventures의 스티브 장은 "모두가 AI 버블이라고 생각했지만 AI 버블은 없다. 인퍼런스 수요가 공급을 훨씬 앞지르고 있다"고 말하며, 콘텐츠 생성과 로보틱스 분야의 본격적 모델 활용이 시작되기도 전이라고 강조했다.