목록으로
연구2026년 6월 6일 PM 03:34

3B 소형 모델 5개로 돌아가는 멀티에이전트 경제 시뮬레이션 '천 토큰 숲'

한 개발자가 'Build Small' 해커톤에 출품하려고 소형 AI 모델만으로 작은 경제를 굴리는 시뮬레이션 '천 토큰 숲(Thousand Token Wood)'을 만들었다. 다섯 마리 숲 동물이 각자 하나의 에이전트가 되어 Qwen2.5-3B 모델 위에서 움직이며, 다섯 가지 물품을 조약돌(화폐)로 사고팔고 소문을 내고 비축하고 공황에 빠진다. 모델은 Modal 위에서 vLLM로 서빙되고, Gradio 앱이 숲을 들여다보는 창 역할을 한다.

개발자는 작은 모델이 한계가 아니라 설계의 핵심이라고 강조한다. 살아 있는 경제는 매 턴 여러 에이전트가 여러 번 생각해야 하는데, 프런티어급 대형 모델은 매번 거래자 집단을 돌리기엔 너무 느리고 비싸다는 것이다. 소형 모델 덕분에 실시간 멀티에이전트 시뮬레이션이 가능해졌고, 각 동물은 매 턴 한 번의 배치 GPU 호출로 의사결정을 내린다.

첫 버전은 작동하지 않았다. 생산이 소비를 앞질러 모든 동물이 자급자족했고, 거래할 이유가 없어 시장은 한 번 정리된 뒤 조용해졌다. 해법은 인위적으로 희소성을 설계하는 것이었다.

개발자는 세 가지 장치를 넣었다. 한 끼에 같은 음식은 한 단위만 먹을 수 있게 해(식단 다양성) 직접 기르지 않는 음식을 사야 살아남게 했고, 상하는 음식은 비축하면 썩게 만들어 가치가 있을 때 팔도록 했다. 또 겨울 연료 위기를 두어 모든 동물이 매 턴 장작을 태워야 하고 그 수요는 시간이 갈수록 커지는데, 장작을 만드는 동물은 단 하나뿐이다. 이 마지막 장치가 드라마를 만든다. 한 공급자가 늘어나는 수요를 못 채우니 나무꾼은 부유해지고 나머지는 온기를 두고 경쟁한다.

희소성을 넣자 소형 모델의 솔직한 교훈이 드러났다. 3B 모델은 모든 호출에서 100% 유효한 JSON을 내놨지만 경제적 판단은 형편없었다. 도토리를 생산하는 동물이 정작 남아도는 도토리를 사겠다는 주문을 올리는 식이었다.

해법은 더 큰 모델이 아니라 더 날카로운 프롬프트였다. 각 에이전트에게 자신이 무엇을 생산하며 절대 사면 안 되는지 알려주고, 부족한 물품 목록을 정확히 계산해 함께 주고, 잘 된 예시를 하나 제시했다. 그러자 판단 품질이 뛰어올랐고 동물들이 자기 역할에 맞게 거래하기 시작했다. 전체 루프는 너그러운 JSON 파싱·복구 계층으로 감싸, 잘못된 응답이 시뮬레이션을 멈추는 대신 아무 행동도 하지 않는 것으로 처리되게 했다.

또 다른 교훈은 동물의 '웰빙' 설계에서 나왔다. 처음엔 이를 누적값으로 모델링했는데, 만성적인 부족이 생기면 한 판 내내 모든 동물이 0으로 떨어지는 죽음의 악순환이 벌어졌다. 개발자는 이를 먹고 따뜻하면 회복되고 절대 0에 닿지 않는, 평균으로 되돌아가는 '기분' 값으로 바꿨다. 긴장감은 굶주림이 아니라 조약돌과 가격, 지위에 담겨야 한다는 것이다.

개발자가 가장 만족하는 기능은 시장 역사와 연결된 '숲의 전설'이다. 플레이어가 유명한 사건을 숲 동화로 바꿔 발동시킬 수 있는데, 튤립 광풍은 '거대 도토리 광풍'이, 남해 거품은 '텅 빈 통나무 무역회사'가, 1929년 뱅크런은 '우나의 곳간 인출 사태'가 된다. 이 전설들은 단순한 장식이 아니라 실제 충격을 일으키고 에이전트가 반응한다. 한 번은 올빼미 우나의 금고가 비었다는 소문이 도는 인출 사태를 발동하자, 우나가 꿀을 팔아 조약돌을 마련하기 시작했고 쏟아진 물량에 꿀 가격이 몇 턴 만에 10에서 3으로 폭락했다. 어느 것도 미리 짜놓은 각본이 아니었다.

그렇게 보이려면 가격이 움직여야 했는데, 처음엔 에이전트들이 보여준 기준 가격을 그대로 따라 불러 가격이 얼어붙어 있었다. 개발자는 매 라운드 뒤 남은 수요·공급에 따라 시장 기준가가 흐르도록 고쳤다. 채워지지 않은 매수가 많으면 가격이 오르고 공급 과잉이면 내려가, 이제 가격은 희소할 때 추세를 그리고 균형 잡힌 거래에서는 잔잔하게 유지된다.

가뭄과 겨울 소문을 중간에 주입한 대표적인 15턴 실행에서, 75번 호출 모두 유효한 JSON 행동을 냈고(100%) 턴당 거래는 3~9건으로 한 번도 끊기지 않았다. 꿀 가격은 뱅크런 전설 동안 10에서 3으로 폭락했고, 장작 가격은 겨울 부족이 닥치며 4에서 7로 올랐다. 부의 격차를 나타내는 지니계수는 0.14에서 0.38로 벌어졌고, 결국 나무꾼이 가장 부유해지고 비축만 하던 동물은 파산했다. 개발자는 소형 모델 작업의 핵심이 신뢰할 만한 형식 생성과 불안정한 추론 사이의 간극을 규모가 아니라 구조와 프롬프트로 메우는 일이며, 풍요가 아니라 설계된 희소성이 창발적 시스템을 만든다고 정리했다.

AI인사이트 편집팀

이 기사는 AI 기술을 활용해 작성되었으며, 편집팀이 검수했습니다.

관련 기사