목록으로
연구2026년 5월 28일 AM 09:06

AWS·일본 WHI, HR 에이전트 운영 비용 97% 절감 사례 공개

AWS Generative AI Innovation Center(GenAIIC)가 일본 HR 시스템 회사 Works Human Intelligence(WHI)와 함께 Amazon Bedrock AgentCore로 업무 지원 AI 에이전트 2종을 구축한 사례를 공개했다. 프로젝트 결과 처리당 비용을 최대 97% 절감하면서 운영 효율을 끌어올렸다는 설명이다.

WHI는 대형 일본 기업과 공공 법인을 대상으로 통합 HR 시스템 'COMPANY'를 개발·공급한다. 조직 개편, HR 제도 개정, 임직원 정보 업데이트 같은 반복 업무를 자동화하기 위해 AI 에이전트 도입을 추진했고, LangGraph와 Amazon ECS·AWS Fargate 기반 PoC를 진행하던 중 Amazon Bedrock AgentCore가 출시되자 마이그레이션을 결정했다.

구축된 첫 에이전트는 'Commuting Allowance Agent'다. 직원의 이사 등으로 발생하는 통근비 신청 승인 업무를 처리한다. WHI 측은 모든 처리가 동일 ECS 태스크에서 실행되는 모놀리식 구성을 우려해 GenAIIC와 함께 서브에이전트가 AgentCore Runtime에서 개별 기동되도록 아키텍처를 재설계했다. 멀티테넌시 지원을 위해 Amazon DynamoDB와 Amazon Cognito로 테넌트를 관리하고, Slack을 진입점으로 삼아 호출 시점에 인증을 수행하도록 설계했다.

두 번째 에이전트는 'Browser Operation Agent'로, 브라우저를 통해 COMPANY 시스템에 접근해 내용을 확인하고 조작하며 증빙을 수집한다. WHI는 LangGraph와 Playwright MCP로 구축을 진행하면서 에이전트 루프의 불필요한 과거 이력 제거, Playwright MCP 반환값 정리, TOOL 부분 프롬프트 캐싱을 통해 브라우저 조작 토큰을 88% 줄이는 성과를 먼저 확인했다.

GenAIIC와의 협업 단계에서는 이 에이전트를 Strands Agents 기반으로 재구축했다. browser-use·Playwright·fast playwright 세 종류의 브라우저 조작 도구를 비교 테스트한 결과 fast playwright가 가장 적은 토큰을 소비하는 것으로 확인됐다. 작업은 사용자 지시에 맞춰 지식 베이스에서 최적의 운영 템플릿을 검색하고, 다른 지식 베이스의 정보로 자리표시자를 치환해 운영 매뉴얼을 만든 뒤 그 매뉴얼에 따라 브라우저를 조작하는 흐름이다.

COMPANY 접근이 IP 제한 환경이라는 점도 해결 과제였다. GenAIIC는 AgentCore Runtime을 VPC 내부에 배치하고 NAT 게이트웨이의 고정 IP를 통해 접근하도록 구성했다. 운영 템플릿과 절차 보조 정보를 저장하는 지식 베이스를 별도 구축했고, 단기 데이터는 Amazon S3 버킷에 보관했다.

비용 절감 효과는 단계별 최적화로 누적됐다. 사용자 메시지에 프롬프트 캐싱을 적용해 처리당 비용이 14.5달러에서 2.1달러로 떨어졌고, 서브에이전트 프롬프트를 최적화해 불필요한 동작을 줄이자 2.1달러에서 1달러로 추가 감소했다. 마지막으로 모델을 Claude Sonnet 4.5에서 Haiku 4.5로 교체한 결과 1달러에서 0.4달러까지 내려갔다. 초기 대비 약 97% 절감이다.

GenAIIC는 비용을 최적화하면서도 여러 변경 작업을 연속 실행하거나 지시가 모호할 때 에이전트가 사람에게 질문하는 등 더 복잡한 시나리오까지 처리할 수 있게 됐다고 밝혔다. WHI는 이 작업을 통해 AgentCore의 Runtime과 부가 기능을 활용하면서 비즈니스 로직 개발에 집중할 수 있는 단계에 도달했다고 평가했다.

AI인사이트 편집팀

이 기사는 AI 기술을 활용해 작성되었으며, 편집팀이 검수했습니다.

관련 기사