제품2026년 6월 3일 AM 05:07

Baz, 아마존 베드록으로 사양까지 검증하는 AI 코드리뷰 에이전트 구축

개발 협업 플랫폼 Baz가 아마존 베드록과 아마존 베드록 에이전트코어를 활용해, 코드가 제품·디자인 사양대로 실제로 동작하는지까지 검증하는 'Spec Review' 에이전트를 구축했다. Baz는 이 솔루션으로 보고된 버그를 최대 50% 줄이고, 병합까지 걸리는 시간을 30~70% 단축했다고 밝혔다.

기존 코드리뷰는 코드가 컴파일되고 동작하는지는 확인할 수 있었지만, 기능·디자인 요구사항을 모두 충족하는지는 알기 어려웠다. QA 팀은 미리보기 환경을 일일이 클릭하며 기능이 의도대로 동작하는지 수동으로 확인했고, 이는 출시를 늦추고 일관성을 떨어뜨리며 회귀 가능성을 키웠다.

Spec Review 에이전트는 다단계 검증 파이프라인으로 동작한다. 웹훅이나 수동 호출로 트리거되면 Figma를 MCP로, Jira를 REST API로 동시에 조회해 기술·제품·디자인 사양을 한데 모은다.

이어 요구사항마다 격리된 하위 에이전트 워커를 띄운다. 이 하위 에이전트는 소스코드 저장소를 통한 코드 검사와 베드록 에이전트코어 브라우저 툴을 이용한 런타임 검증을 결합한다. 임시 환경에 접속해 DOM 검사, 이벤트 시뮬레이션, 시각 테스트를 수행하며 배포된 구현이 Figma 디자인과 행위 요구사항에 맞는지 확인한다.

아키텍처를 보면, GitHub 웹훅이 새 풀 리퀘스트에서 트리거되면 트래픽이 애플리케이션 로드 밸런서와 네트워크 로드 밸런서를 거쳐 아마존 EKS 클러스터로 들어간다. Baz 플랫폼이 중앙 오케스트레이션 계층 역할을 하며 다중 에이전트 검토 과정을 조율한다. 명세 하위 에이전트는 Figma의 시각 사양과 Jira의 기능 사양을 받아 간격·색상·컴포넌트 위계 같은 시각 요구사항과 인수 기준·유저스토리 의도 같은 기능 요구사항으로 분해한다.

핵심은 구현 하위 에이전트다. 정적 코드 분석에만 의존하지 않고 라이브 미리보기 환경에 실제 구현을 렌더링해, UI가 Figma 디자인과 일치하는지, 기능이 Jira 명세대로 동작하는지 시각적으로 검증한다. 덕분에 전통적 코드리뷰 도구가 놓치던 불일치를 잡아낼 수 있다.

리포트 생성기는 모든 하위 에이전트의 결과를 하나의 검토 요약으로 통합한다. 검토가 끝나면 GitHub PR에 코멘트가 달리고, 팀 공유를 위해 Slack으로 알림이 가며, 발견된 문제는 추적과 해결을 위해 Jira 이슈로 자동 연결된다.

베드록 에이전트코어는 안전하고 격리된 서버리스 브라우저 세션을 제공해, 별도의 브라우저 인프라나 맞춤 오케스트레이션 없이도 에이전트가 미리보기 환경을 열고 사용자처럼 기능을 점검하게 한다. 추론과 판단은 베드록의 매니지드 파운데이션 모델이 맡아 사양 맥락을 종합하고 UI 상태를 분석한다. Baz는 이 조합으로 수동 검증 작업을 크게 줄이고, 기능 검증을 개발 초기로 앞당겨 풀 리퀘스트 단계에서 자동으로 이뤄지게 했다고 설명했다.

Baz, 아마존 베드록으로 사양까지 검증하는 AI 코드리뷰 에이전트 구축

관련 기사