앤스로픽 클로드 오퍼스 4.8 공개, 클로드 코드에 병렬 서브에이전트 워크플로우 더했다
앤스로픽이 자사 대규모 언어모델의 새 버전인 클로드 오퍼스 4.8을 공개했다. 이번 업데이트에서 가장 눈에 띄는 변화는 코딩 도구 클로드 코드에 추가된 동적 워크플로우다.
동적 워크플로우에서 클로드는 먼저 작업을 처리할 오케스트레이션 스크립트를 직접 작성한 뒤, 여러 서브에이전트를 병렬로 띄워 복잡한 작업을 나눠 처리한다.
다만 이 방식이 느슨한 멀티에이전트 시스템의 효용을 입증한 것은 아니라는 신중론도 있다. 덱스(Dex)는 작은 에이전트 루프를 결정론적 워크플로우로 감싸는 편이 더 신뢰성이 높다고 평가했다.
모델 자체에 대한 평가는 엇갈렸다. 사이먼 윌리슨은 오퍼스 4.8을 완만하지만 유용한 업그레이드로 봤다. 불확실성을 더 정직하게 인정하고, 자신이 작성한 코드의 결함을 놓칠 가능성이 낮아졌다는 점을 이유로 들었다.
반면 Every의 사용기는 더 긍정적이었다. 4.7에서 큰 폭으로 도약했고 코딩·글쓰기·지식노동에 두루 강하며, 자체 시니어 엔지니어 벤치마크에서 GPT-5.5와 경쟁할 수준이라고 평가했다.
다만 Every는 모델은 돌아왔지만 클로드 앱(하니스)이 여전히 코덱스(Codex)보다 다듬어지지 않은 느낌이라는 점을 단점으로 꼽았다.
벤치마크 성적은 시각에 따라 달랐다. 오퍼스 4.8은 ARC-AGI-3에서 최고 점수를 기록하며 GPT-5.5 점수의 세 배를 냈다.
반대로 데이터커브(Datacurve)의 새 벤치마크에서는 GPT-5.5보다 낮고 5.4보다 근소하게 나은 데 그쳤으며, 훨씬 많은 토큰을 소비해 비용 부담이 크다는 지적도 나왔다.