Datawhale, AI 네이티브 에이전트 교본 'Hello-Agents' 공개… GitHub 4만+ 스타·5부 16장, ReAct·MCP·Agentic-RL부터 사이버 소도시·DeepResearch까지
Datawhale 커뮤니티가 시스템적 에이전트 학습 교본 'Hello-Agents'를 공개했다. 프로젝트는 2024년이 '100개 모델 대전(백모대전)'의 원년이라면 2025년은 의심할 여지 없이 'Agent 원년'을 열었다고 진단하며, 기술의 초점이 더 큰 기반 모델 학습에서 더 똑똑한 지능형 에이전트 애플리케이션 구축으로 옮겨가고 있다고 짚었다. 그러나 현재 체계적이고 실전 중심인 튜토리얼은 극도로 부족하다는 문제의식에서 출발했다.
프로젝트는 현재 Agent 구축 진영을 두 갈래로 분류한다. 하나는 Dify·Coze·n8n과 같은 '소프트웨어 엔지니어링형 Agent'로, 본질적으로 흐름 제어 기반 소프트웨어 개발이며 LLM은 데이터 처리 백엔드 역할을 맡는다. 다른 하나는 AI가 진짜로 주도하는 'AI 네이티브 Agent'다. Hello-Agents는 후자에 초점을 맞춰 학습자가 LLM '사용자'에서 에이전트 시스템 '구축자'로 변모하도록 돕는 것을 목표로 한다.
전체 구성은 5부 16장이다. 1부(1~3장)는 에이전트와 대언어모델 기초로, 에이전트 정의·유형·역사적 발전(상징주의에서 LLM 주도까지)과 Transformer·프롬프트·주류 LLM 한계를 다룬다. 2부(4~7장)는 대언어모델 에이전트 구축 단계로, ReAct·Plan-and-Solve·Reflection 패러다임 직접 구현, Coze·Dify·n8n 저코드 플랫폼 사용법, AutoGen·AgentScope·LangGraph 등 주류 프레임워크 활용, 마지막으로 OpenAI 네이티브 API 기반 자체 프레임워크 'HelloAgents' 처음부터 구축을 포함한다.
3부(8~12장)는 고급 지식 확장이다. 자체 개발 프레임워크를 사용해 기억과 검색(RAG·저장)·맥락 공학(컨텍스트 엔지니어링)·MCP·A2A·ANP 등 에이전트 통신 프로토콜·Agentic-RL(SFT부터 GRPO까지의 LLM 학습 실전)·에이전트 성능 평가(핵심 지표·벤치마크·평가 프레임워크)를 깊이 있게 탐구한다. 4부(13~15장)는 종합 사례로, MCP·다중 에이전트 협업 기반 '지능형 여행 도우미', DeepResearch Agent 재현·해설, 사회 동학을 시뮬레이션하는 '사이버 소도시(赛博小镇)'를 구축한다. 5부(16장)는 졸업 설계로, 학습자 자신만의 완성형 다중 에이전트 애플리케이션을 만든다.
선수 지식은 기초 Python 프로그래밍 능력과 대언어모델에 대한 개념적 이해(예: API로 LLM 호출 방법) 정도로 설정됐다. 프로젝트는 응용·구축에 중점을 두므로 깊은 알고리즘이나 모델 학습 배경이 없어도 학습할 수 있다고 명시한다. 또한 모든 코드는 저장소의 code 폴더에서 함께 제공되며, 이론과 실습을 결합해 직접 실행·디버깅·수정해볼 것을 강력히 권장한다.
커뮤니티 기여 섹션에는 졸업 설계 공동 창작, Agent 면접 문제 모음·답안, 컨텍스트 공학 보충, Dify 에이전트 생성 가이드, Hello-Agents 강의 FAQ, Agent Skills와 MCP 비교 해설, GUI Agent 과학·실전, 환경 설정, 좋은 Skill 작성법, Code Agent 개발 경험담, Agent Self-Evolution(자기 진화) 4가지 폐쇄 루프 등 11개 항목이 등재돼 있다.
Hello-Agents PDF 교본은 완전 오픈소스·무료다. 마케팅 계정이 워터마크를 추가해 초보자에게 판매하는 것을 막기 위해 PDF 파일에는 가독성에 영향이 없는 Datawhale 오픈소스 표시 워터마크가 미리 삽입돼 있다. 다운로드는 GitHub Releases 페이지와 datawhale.cn 학습 요약 페이지에서 가능하다. 프로젝트 측은 비디오 강의를 순차 공개하고 있으며, HelloAgents 프레임워크는 V1.0.0으로 업데이트돼 학습 버전과 호환되는 더 가볍고 실용적인 도구·기능을 추가할 예정이다.
프로젝트 책임자는 Datawhale 멤버 천쓰저우(陈思州)이며, 공동 발기인은 Datawhale·CAMEL-AI 멤버 쑨타오(孙韬, 9장 집필·교정)와 Datawhale 멤버 장수판(姜舒凡, 단원 연습 설계·교정)이다. 지도 전문가는 Datawhale 수석과학자이자 저장사범대학교 항저우인공지능연구원 교수인 주신중(朱信忠)이며, 5장은 황페이린(黄佩林), 14장 사례는 짱신민(曾鑫民) 등이 기여했다. 작품은 크리에이티브 커먼즈 저작자표시-비영리-동일조건변경허락 4.0 국제 라이선스로 배포된다.
저장소는 GitHub 트렌딩에 누적 44,154 스타·오늘 645 스타로 올랐다. 프로젝트는 4만 스타 돌파를 기념해 향후 학습 콘텐츠 수요 조사 설문을 진행 중이며, 후속작으로 '제로부터 에이전트 학습시키기(从零开始训练智能体)'를 통해 사용자 정의 시나리오 에이전트 모델을 처음부터 학습시키는 능력을 모든 학습자가 갖추도록 돕겠다고 밝혔다.