제품2026년 5월 5일 AM 04:10

AWS, SageMaker AI에 에이전트 가이드 모델 커스터마이제이션 도입… 9개 모듈 스킬·SFT/DPO/RLVR 자동 추천, JupyterLab Kiro 기본·ACP Claude Code 호환

AWS가 Amazon SageMaker AI에 에이전트 기반 모델 커스터마이제이션 경험을 도입했다. 개발자가 자연어로 유스케이스를 기술하면, AI 코딩 에이전트가 유스케이스 정의·데이터 준비부터 기법 선택, 평가, 배포까지 전체 여정을 가이드한다. 생성된 모든 코드는 편집 가능하며, 기존 워크플로에 매끄럽게 통합되는 재사용 아티팩트로 만들어진다.

AWS는 모든 조직이 같은 파운데이션 모델에 접근하므로 진짜 경쟁우위는 자체 데이터·도메인 전문성으로 모델을 커스터마이즈하는 데서 나온다고 본다. 그러나 Supervised Fine-Tuning(SFT)·Direct Preference Optimization(DPO)·Reinforcement Learning Verifiable Rewards(RLVR) 같은 파인튜닝 기법을 익히고, 파편화된 API와 모델별 데이터 형식을 다루며, 엄격한 평가를 설계하고, 수개월에 걸친 실험 사이클을 관리해야 해 숙련 팀에도 복잡한 작업이다.

에이전트 경험의 핵심은 모델 커스터마이제이션을 위한 'Skills'다. 사전 빌드된 모듈식 명령 집합으로 AWS와 데이터 사이언스 전문성을 커스터마이제이션 라이프사이클 전반에 인코딩한다. 유스케이스를 기술하면 AI 코딩 에이전트가 관련 스킬을 활성화해 데이터 준비·검증, 기법 선택, 하이퍼파라미터 구성, 모델 평가, 배포로 이끌고, 각 단계에서 즉시 실행 가능한 노트북을 생성한다. 스킬은 완전 커스터마이즈가 가능해 팀의 워크플로·거버넌스 표준·도구 선호에 맞게 수정할 수 있다.

SageMaker AI Studio JupyterLab은 ACP(Agent Communication Protocol) 기반 통합 에이전틱 개발 환경을 지원한다. 채팅 패널에는 Amazon의 AI 소프트웨어 개발 에이전트인 Kiro가 기본 구성되어 AI 코드 자동완성, 디버깅 지원, 인터랙티브 코딩 지원을 JupyterLab 환경 내부에서 제공한다. SageMaker AI JupyterLab에서 코딩 에이전트를 사용하면, 스페이스가 관련 SageMaker AI 모델 커스터마이제이션 스킬을 자동으로 에이전트 컨텍스트에 로드한다. ACP 호환 코딩 에이전트로 Claude Code 등 다른 도구도 구성 가능하며, 같은 스킬 통합을 누릴 수 있다.

SageMaker AI 에이전트 스킬은 Agent Skills 오픈 포맷을 따른다. 에이전트 가이드 모델 커스터마이제이션 워크플로는 풀 커스터마이제이션 라이프사이클을 다루는 9개 모듈 스킬로 구동된다. Use Case Specification(비즈니스 문제·사용자·성공 기준 구조화 디스커버리), Planning(유스케이스 맞춤 다단계 커스터마이제이션 계획 동적 생성), Fine-tuning Setup(SageMaker AI Hub에서 베이스 모델 선택, SFT/DPO/RLVR 추천), Dataset Evaluation(학습 전 데이터셋 포맷·스키마 검증), Dataset Transformation(OpenAI chat·SageMaker AI·Hugging Face·Amazon Nova 등 ML 데이터 포맷 간 변환), Fine-tuning(SageMaker AI 서버리스 파인튜닝 학습 노트북 생성), Model Evaluation(빌트인·커스텀 메트릭이 있는 LLM-as-Judge 평가 구성), Model Deployment(SageMaker AI 엔드포인트 또는 Bedrock 배포 경로 결정 및 코드 생성)이 포함된다.

현재 지원되는 파인튜닝 기법은 세 가지로, Planning 단계에서 유스케이스에 맞는 기법이 추천된다. SFT는 입출력 쌍으로 학습해 명령 따르기·형식 준수·도메인 적응 응답 같은 작업 특화 행동에 적합하다. DPO는 선호된 출력과 거부된 출력으로 학습해 톤·스타일·주관적 선호를 인간 판단에 맞게 정렬할 때 유리하다. RLVR은 코드 기반 보상 함수로 학습하므로 정확성을 프로그램적으로 검증 가능한 작업에 적합하다.

사전 요건으로는 AWS 계정, SageMaker AI 도메인 접근 또는 생성 권한, 필요한 권한이 부여된 IAM 역할, S3 버킷, SageMaker AI Studio JupyterLab 컴퓨트 스페이스가 필요하다. 새 기능 사용에 최소 인스턴스 타입 요구는 없으며, 발행 시점 기준 SageMaker AI Distribution 이미지 4.1 이상이 요구된다. 도메인 실행 역할에는 AmazonSageMakerFullAccess 관리형 정책과 Lambda·S3·Bedrock 접근을 위한 인라인 정책을 부착해야 하며, 신뢰 정책은 sagemaker.amazonaws.com, lambda.amazonaws.com, bedrock.amazonaws.com 세 서비스가 역할을 가정할 수 있도록 허용해야 한다.

솔루션 구현 예시로는 소형 언어 모델(SLM)을 FreedomIntelligence/medical-o1-reasoning-SFT 데이터셋으로 파인튜닝해, 진단을 내리기 전에 의료 케이스를 단계별로 추론하는 임상 추론 모델을 만든다. 이는 범용 모델을 도메인 특화 추론 작업에 특화시키는 시연이다. 다른 유스케이스를 시도하려면 SageMaker AI가 SFT·DPO·RLVR 기법별로 시작점으로 쓸 수 있는 샘플 데이터셋 라이브러리를 제공한다.

사용 흐름은 SageMaker AI Studio에서 좌측 내비게이션의 Spaces로 이동하거나 모델 허브의 'Customize with agent'를 클릭해 시작한다. JupyterLab 애플리케이션이 포함된 스페이스를 새로 만들거나 기존 스페이스를 연다. 코딩 에이전트(Kiro·Claude Code·Cursor 등)는 대화형 인터페이스를 제공하고, SageMaker AI Skills가 워크플로를 오케스트레이션한다. 에이전트와 상호작용하면 AWS가 제공하는 MCP 서버를 통해 SageMaker AI API 호출, S3 데이터 소스 접근, 모델 레지스트리 상호작용이 이뤄지고, 각 단계가 기존 ML 파이프라인에서 실행되도록 Jupyter 노트북이 자동 생성된다.

AWS, SageMaker AI에 에이전트 가이드 모델 커스터마이제이션 도입… 9개 모듈 스킬·SFT/DPO/RLVR 자동 추천, JupyterLab Kiro 기본·ACP Claude Code 호환

관련 기사