연구2026년 6월 16일 AM 03:34

AWS, 딥에이전트·베드락 에이전트코어로 리서치 에이전트 만드는 법 공개

아마존웹서비스(AWS)가 머신러닝 블로그를 통해 LangChain Deep Agents와 아마존 베드락 에이전트코어(Amazon Bedrock AgentCore)로 경쟁사 분석용 리서치 에이전트를 만드는 방법을 단계별로 공개했다. AI 리서치 워크플로가 흔히 겪는 '깊이 대 컨텍스트'의 딜레마를 푸는 것이 핵심이다. 에이전트가 웹페이지 열 개를 읽으면 컨텍스트 창이 원본 텍스트로 가득 차고, 데이터 분석 코드까지 돌리면 차트 생성 로직이 전략적 추론과 제한된 공간을 두고 경쟁하게 된다.

해법은 깊은 작업을 격리된 서브에이전트에 위임하고 간결한 결과만 돌려받는 구조다. LangChain Deep Agents가 전문화된 일회성 서브에이전트를 생성하고 수명주기를 관리하는 오케스트레이션을 맡고, 베드락 에이전트코어가 각 서브에이전트에 필요한 인프라를 제공한다. 여기에는 웹 리서치용으로 마이크로VM(MicroVM) 안에서 도는 실제 브라우저와 데이터 분석용 파이썬 환경이 포함된다.

에이전트코어는 Deep Agents CLI의 기본 샌드박스 제공자로도 쓸 수 있어, deepagents --sandbox agentcore 명령으로 전체 에이전트를 만들지 않고도 에이전트코어 코드 인터프리터를 시험해 볼 수 있다. 글의 2부에서는 같은 에이전트를 에이전트코어 CLI로 베드락 에이전트코어 런타임에 배포해, 세션이 격리된 관리형 서비스로 돌리는 방법을 다룬다.

전체 흐름은 이렇다. 코디네이터 에이전트가 요청을 받아 먼저 에이전트코어 메모리에서 과거 리서치 인사이트를 확인한다. 이어 브라우저 서브에이전트 세 개를 병렬로 띄워 각자 다른 경쟁사 웹사이트를 자기만의 에이전트코어 브라우저 마이크로VM에서 탐색한다. 세 에이전트가 구조화된 결과를 돌려주면 분석가 서브에이전트가 이를 합쳐 에이전트코어 코드 인터프리터로 비교 차트와 마크다운 리포트를 만들고, 핵심 인사이트는 다음 세션을 위해 다시 메모리에 저장한다.

각 서브에이전트는 자기 역할에 필요한 도구만 쓴다. 리서처는 브라우저 도구, 분석가는 인터프리터 도구, 코디네이터는 메모리 도구에만 접근한다. 전체 워크플로는 아마존 클라우드워치를 통한 에이전트코어 옵저버빌리티나 랭스미스(LangSmith)로 추적할 수 있다.

모델 단계에서는 아마존 베드락을 통해 클로드 소네트(Claude Sonnet)를 사용한다. 모델 ID 앞에 us. 접두사를 붙이면 가용성을 높이는 교차 리전 추론 프로파일을 쓰게 되며, 기본 모델 ID를 그대로 써도 된다.

브라우저 단계에서는 경쟁사마다 별도의 BrowserToolkit이 자체 마이크로VM을 띄워 병렬 리서처 사이를 완전히 격리한다. 각 마이크로VM은 플레이라이트(Playwright)로 웹소켓을 통해 연결된 실제 크로미엄 브라우저를 구동하며, 세션은 일회성이고 수 초 만에 뜬다. 여러 도구 호출이 동시에 돌 때 작업이 끝날 시간을 주기 위해 세션 대기 시간(session_wait_timeout)은 기본 10초에서 60초로 늘려 둔다. 브라우저 도구로는 navigate_browser, extract_text, click_element, type_text, scroll_page, extract_hyperlinks, wait_for_element이 제공된다.

분석가 서브에이전트가 쓰는 에이전트코어 코드 인터프리터는 판다스(pandas), 맷플롯립(matplotlib), 넘파이(numpy)가 미리 설치된 완전한 파이썬 환경을 갖춘 격리형 마이크로VM이다. 인터프리터 도구로는 execute_code, execute_command, write_files, read_files, list_files, upload_file, install_packages이 있으며, 추가 라이브러리가 필요하면 install_packages로 런타임에 더할 수 있다.

선택 사항인 교차 세션 메모리를 쓰면 코디네이터가 시간이 지나며 전문성을 쌓을 수 있다. 다만 장기 기억이 작동하려면 에이전트코어 메모리 리소스에 시맨틱 메모리 전략(semanticMemoryStrategy) 같은 추출 전략이 최소 하나는 설정돼 있어야 한다. 에이전트가 인사이트를 저장하면 설정된 전략이 백그라운드에서 구조화된 지식을 자동 추출하고, 이후 실행에서는 recall_past_research로 이 지식을 검색해 처음부터 다시 조사하지 않고도 관련 사실을 찾아낸다.

AWS에 따르면 클로드 소네트로 이 에이전트를 실행할 때 예상 소요 시간은 실제 브라우저가 세 사이트를 도는 시간을 반영해 4~6분이며, 같은 리서치를 순차로 처리하면 최대 3배까지 걸린다. 관찰성 측면에서 에이전트코어는 OpenTelemetry(OTEL) 형식으로 트레이스와 스팬을 내보내 클라우드워치 GenAI 옵저버빌리티 페이지에서 전체 오케스트레이션 계층을 볼 수 있고, 목표 달성률과 도구 선택 정확도 같은 내장 평가자를 제공하는 에이전트코어 이밸류에이션으로 품질을 채점할 수도 있다.

AWS, 딥에이전트·베드락 에이전트코어로 리서치 에이전트 만드는 법 공개

관련 기사