Warp, GPT-5.5로 코딩 에이전트 토큰 30% 절감…사내 PR 90% 자동화
OpenAI가 자사 블로그에서 Warp가 GPT-5.5를 도입해 코딩 에이전트 오케스트레이션을 강화했다고 공개했다. 같은 에이전트 코딩 작업에 GPT-5.4 대비 30% 적은 토큰을 사용하며, Warp 사내 엔지니어링 조직에서는 PR의 약 90%가 에이전트와 함께 만들어진다.
Warp는 빠른 속도, 협업 기능, 명령 워크플로우, AI 네이티브 인터페이스로 개발자들에게 호평받은 모던 터미널로 출발했다. 코딩 에이전트가 실험 단계를 넘어 일상 엔지니어링 워크플로우로 자리잡으면서 터미널이 명령·컨텍스트·협업·리뷰가 모이는 자연스러운 작업 공간이 됐다고 회사는 봤다.
Warp는 올해 터미널 클라이언트를 오픈소스로 공개했고 OpenAI가 해당 리포의 'founding sponsor'가 됐다. 동시에 사람은 목표를 정의하고 결과를 감독하며 에이전트는 계획·코드 작성·테스트·풀리퀘스트 생성을 맡는 'Open Agentic Development' 모델을 제시했다.
OpenAI는 GPT-5.5가 더 큰 문제 공간에 걸쳐 추론하고 사람 리뷰에 적합하도록 작업을 정리한다고 설명했다. 내부 벤치마크 기준 GPT-5.5는 같은 에이전트 코딩 작업당 GPT-5.4 대비 30% 적은 토큰을 사용해 장시간 에이전트 워크플로우 확장에 도움이 된다는 평가다.
Warp는 현재 약 100만 명의 개발자와 포춘 500 기업의 56% 이상을 사용자로 두고 있다. Warp 사내 엔지니어링 조직에서는 PR의 약 90%를 에이전트가 공동 작성하고 있어 장시간 에이전트 워크플로우에 필요한 관측성·조율·메모리·사람 리뷰 요건을 자사 운영으로 직접 검증하고 있다고 회사는 밝혔다.
Warp는 영속적이고 병렬화된 에이전트 운영에 필요한 공유 메모리, 재현 가능한 환경, 평가 시스템, 권한, 작업 조율 컴포넌트를 묶어 클라우드 오케스트레이션 플랫폼 'Oz'를 구축했다. Oz는 로컬과 클라우드를 가로질러 에이전트를 배포·조율하는 컨트롤 플레인 역할을 맡는다.
Oz에서는 개발자가 웹 인터페이스로 에이전트를 시작하고 사전 정의된 스킬·환경, 모델과 호스팅 구성을 선택한 뒤 장시간 워크플로우를 중앙에서 모니터링한다. 에이전트는 클라우드와 로컬을 오가며 컨텍스트를 잃지 않고 계속 실행되고, 스케줄된 크론 잡처럼 반복 워크플로우도 지원된다.
Oz는 컨텍스트 컴팩션, 영속 메모리, 코드 검색·파일 분석용 전용 서브에이전트 같은 기법으로 누적되는 상태 속에서 집중력과 핵심 결정을 보존한다. Warp 에이전트는 작업을 유형과 난이도로 분류해 더 복잡한 코딩·추론 작업을 강한 모델 구성으로 라우팅하며, GPT-5.5는 까다로운 에이전트 코딩 워크플로우에 쓰이는 OpenAI 모델 믹스의 일부다. OpenAI 모델은 평가 파이프라인 내 LLM-as-a-judge 역할로도 활용된다.
Warp는 연환산 매출(ARR)이 지난해 35배 성장했고 엔터프라이즈 매출은 2025년 4분기 이후 500% 넘게 증가했다고 밝혔다. 회사는 이 성장의 상당 부분이 에이전트 워크플로우를 더 유연하게 확장하려는 조직들에서 오고 있다고 설명했다.
Warp의 Lloyd는 "에이전트 개발의 미래가 정확히 어떤 모습일지는 아무도 모른다. 우리는 커뮤니티가 그 모습을 함께 만들 수 있어야 한다고 본다"고 말했다. 회사는 오픈소싱과 Open Agentic Development를 통해 에이전트의 자율성이 커지는 과정에서 오케스트레이션·감독·검증 시스템 형태를 커뮤니티가 함께 설계할 수 있기를 기대한다고 덧붙였다.