AI 코딩툴, 코드 에디터에서 터미널로 이동…개발 패러다임 변화 예고
AI 기반 코딩 툴의 중심이 코드 편집기에서 터미널로 이동하는 흐름이 뚜렷해지고 있다. 그동안 Cursor, Windsurf, GitHub Copilot 등이 AI 개발 도구의 표준처럼 활용됐지만, 최근 강력해진 에이전틱 AI(agentic AI)와 ‘바이브 코딩’ 트렌드가 맞물리면서 AI가 소프트웨어와 상호작용하는 방식이 근본적으로 달라지고 있다는 분석이 나온다.
터미널은 1990년대 해커 영화에서 보던 검은 화면의 오래된 인터페이스지만, 프로그램 실행과 환경 설정 등에서 여전히 강력한 도구다. 기존 AI 코딩 툴이 코드 작성과 디버깅에 집중했다면, 터미널 기반 툴은 프로그램 실행 환경 전반을 다룰 수 있어 더 넓은 범위의 작업을 처리할 수 있다는 평가다.
실제로 주요 AI 연구소들도 터미널 중심의 도구를 잇달아 출시하고 있다. Anthropic은 Claude Code, DeepMind는 Gemini CLI, OpenAI는 CLI Codex를 선보였으며, 이들은 빠르게 인기 제품으로 자리 잡았다. 터미널 벤치마크(Terminal-Bench)를 만든 마이크 메릴은 “앞으로 LLM과 컴퓨터 간 상호작용의 95%가 터미널 같은 인터페이스에서 이뤄질 것”이라고 전망했다.
이러한 변화는 기존 코드 편집기 기반 툴의 한계와도 맞물린다. AI 코드 에디터 Windsurf는 인수합병과 인력 이탈로 미래가 불투명해졌고, 경쟁 제품 Cursor Pro도 생산성 향상 효과가 과대평가됐다는 연구 결과가 나왔다. METR 연구에 따르면 사용자들은 작업 속도가 20~30% 빨라졌다고 느꼈지만, 실제로는 약 20% 더 느려졌다.
이 틈새를 파고든 것이 Warp다. Warp는 IDE와 터미널의 중간 지점을 지향하는 ‘에이전틱 개발 환경’을 표방하며 Terminal-Bench에서 최고 점수를 기록했다. Warp 창업자 잭 로이드는 “터미널은 개발자 스택의 가장 낮은 레벨에 있어 가장 유연한 환경”이라며 “새 프로젝트 설정, 의존성 파악, 실행 환경 구성 같은 작업은 거의 자율적으로 처리할 수 있다”고 설명했다.
기존 코드 편집기 툴이 GitHub 이슈 해결을 중심으로 한 SWE-Bench 벤치마크를 기준으로 발전했다면, Terminal-Bench는 DevOps와 환경 설정까지 포함한 종합적인 문제 해결 능력을 요구한다. 예컨대 리눅스 커널을 소스코드부터 빌드하거나, 압축 해제된 파일로 역설계된 압축 알고리즘을 찾아내는 등 더 복잡한 과제가 주어진다.
Warp는 Terminal-Bench 문제의 절반 이상을 해결하며 가능성을 보여줬지만, 여전히 터미널의 잠재력을 완전히 열기까지는 시간이 필요하다. 그럼에도 업계에서는 터미널 기반 AI 툴이 개발자의 비코딩 업무까지 처리하며 새로운 가치 제안을 하고 있다는 평가가 나온다.
AI가 코드 편집기에서 벗어나 터미널로 이동하면서 소프트웨어 개발의 패러다임이 다시 한 번 변화하고 있다. 업계는 이 변화가 가져올 새로운 생태계를 주목하고 있다.