목록으로
제품2026년 6월 1일 PM 08:06

AI 에이전트에 '복종'을 강제하는 오픈소스 오케스트레이션 도구 '베이비시터'

AI 코딩 에이전트가 정해진 절차에서 벗어나지 않도록 '강제'하는 오픈소스 오케스트레이션 도구 '베이비시터(Babysitter)'가 깃허브에서 주목받고 있다. 개발사는 베이비시터가 에이전트 작업단(agentic workforce)에 복종을 강제해, 결정론적이고 환각 없는(hallucination-free) 자율 조율 방식으로 매우 복잡한 작업과 워크플로를 다루게 한다고 설명한다.

핵심은 '워크플로를 코드로 정의'한다는 점이다. 베이비시터는 정의된 모든 단계를 강제 집행하고, 다음 단계로 넘어가기 전에 품질 게이트를 통과하도록 보장하며, 미리 정한 중단점(breakpoint)에서는 사람의 승인을 요구한다. 또한 모든 결정을 변경할 수 없는 저널(immutable journal)에 기록해, 에이전트가 절차가 허용한 일만 하고 그 이상은 하지 못하게 한다.

베이비시터는 여러 AI 코딩 하니스를 지원한다. 클로드 코드, 코덱스(Codex), 커서(Cursor), 제미니 CLI, 깃허브 코파일럿 CLI, Pi, omp, 오픈코드(opencode) 등 사용 중인 하니스에 맞는 플러그인을 설치하는 방식이다. 사전 요구사항으로는 Node.js 20.0.0 이상(22.x LTS 권장)과 최신 버전의 클로드 코드가 필요하다.

외부 AI 코딩 에이전트 없이도 동작하는 '내부 하니스(internal harness)'도 함께 제공한다. 이 내부 하니스는 SDK에 내장된 Pi 실행 엔진을 직접 사용해 프로세스를 프로그래밍적으로 실행하며, CI/CD 파이프라인이나 스크립트, 자동화 테스트, 헤드리스 오케스트레이션에 활용할 수 있다고 개발사는 설명한다.

내부 하니스로 실행하는 프로세스는 시스템에 설치된 다른 하니스로 작업을 위임할 수도 있다. 즉 내부 하니스로 도는 프로세스가 클로드 코드·코덱스·제미니 CLI 등으로 하위 에이전트 작업을 분산시킬 수 있으며, SDK가 실행 시점에 사용 가능한 하니스 CLI를 탐지해 작업을 알맞게 라우팅한다. 하나의 헤드리스 진입점에서 여러 에이전트 워크플로를 조율할 수 있다는 의미다.

플러그인 체계도 일반적인 코드 모듈과 다르다. 베이비시터 플러그인은 확장 포인트를 가진 코드 모듈이 아니라, AI 에이전트가 읽고 실행하는 자연어 지시문(마크다운 파일)이나 결정론적으로 코딩된 프로세스(JS 파일)의 묶음이다. SDK는 이 지시문을 저장·버전 관리·배포하고, 실제 실행 주체(런타임)는 AI 에이전트가 된다.

공식 마켓플레이스에는 보안(gitleaks, ESLint 보안 규칙, 감사 프로세스), 테스트(Vitest·Playwright·pytest 설정, 커버리지 게이트, TDD 프로세스), 배포(Terraform·Helm·Dockerfile, 다중 환경 파이프라인), 테마, CI/CD(깃허브 액션 워크플로), 속도 제한(지수 백오프 훅) 등을 위한 플러그인이 포함돼 있다.

설치 후에는 user-install 명령으로 중단점 선호도·도구 선호도·전문 분야 등을 담은 개인 프로필을 만들고, project-install 명령으로 코드베이스를 분석해 프로젝트별 워크플로와 테스트 프레임워크, CI/CD 연동, 기술 스택을 설정한다. doctor 명령으로는 정상 동작 여부를 진단할 수 있다.

실행 모드는 승인을 위해 멈추는 대화형(call), 중단점 없이 완전 자동으로 도는 자율형(yolo), 실행 전 프로세스를 검토하는 계획형(plan), 모니터링·주기 작업을 위해 무한히 실행되는 연속형(forever)으로 나뉜다. 이 밖에 실시간 모니터링 대시보드를 띄우는 observe, 중단된 실행을 이어가는 resume 등의 명령도 제공한다.

AI인사이트 편집팀

이 기사는 AI 기술을 활용해 작성되었으며, 편집팀이 검수했습니다.

관련 기사