IBM, '에이전트 로직'으로 기업용 AI 에이전트 토큰 소비 최대 30배 줄였다
IBM 리서치가 허깅페이스 블로그에 공개한 글에서 대형언어모델(LLM)만으로는 기업용 AI 에이전트를 확장하기 어렵다며 '에이전트 로직(agent logic)'이라는 개념을 제시했다. 많은 AI 파일럿이 실패했다는 연구들을 인용하며, AI가 기업 워크플로의 핵심에서 작동해야 확장 가능한 도입이 가능하다고 봤다.
IBM은 기업 워크플로의 특성을 세 가지로 정리했다. 동적이고 장시간 이어지며, 수많은 API·데이터베이스·서비스를 포함하고, 종종 비즈니스 정책이나 규제의 제약을 받는다는 것이다. 이런 환경에서 에이전트가 제대로 작동하려면 더 넓은 모델 컨텍스트가 필요한데, 최신 프런티어 LLM이 이를 갖추고는 있지만 환각 증가와 토큰 소비라는 대가가 따른다고 지적했다.
IBM이 말하는 에이전트 로직은 지식 그래프, 알고리즘, 프로그램 분석 라이브러리 같은 소프트웨어 기본 요소를 가리킨다. 이들은 에이전트 하네스 안, 즉 에이전트 계층에서 작동하며 LLM을 기업 워크플로 방향으로 의도적으로 유도해 컨텍스트 공간을 줄인다. 그 결과 더 나은 성능을 더 비용 효율적으로 끌어낸다는 설명으로, 회사는 이를 GPS 같은 '지능형 안내자'에 비유했다.
첫 번째 적용 사례는 코볼·PL/1로 작성된 레거시 코드 이해다. IBM은 메인프레임 애플리케이션 현대화를 돕는 '왓슨x 코드 어시스턴트 포 Z(WCA4Z)'에 애플리케이션 이해용 'App Insights' 에이전트를 넣었다. 이 에이전트는 정적 분석 결과를 수백 개의 상호 연관된 테이블로 이뤄진 데이터베이스 스키마에 미리 색인해 두고 정확한 정보를 구조적으로 꺼내 쓴다. 미스트랄 미디엄 250B 모델을 사용했으며, 최대 100만 줄·1,000개 프로그램 규모의 미션 크리티컬 레거시 시스템에서 프런티어 LLM만 쓰는 방식보다 약 30배 적은 토큰으로 비슷하거나 약간 더 나은 이해 성능을 유지했다.
두 번째는 개발자용 테스트 생성을 돕는 'Aster'다. 단위·통합·API·변경 기반 테스트를 에이전트로 생성하는 IBM 독자 프로그램 분석 라이브러리로, 여러 개발자 커뮤니티 분석에서 오픈소스 도구나 개발자가 직접 짠 테스트보다 높은 평가를 받았다. IBM은 최대 560여 개 클래스, 6만 7,000줄 이상 규모의 자바 사내(CIO) 애플리케이션 75개 이상에서 데브스트랄 24B 모델로 Aster를 사전 운영 단계에서 돌리고 있다. 그 결과 라인·브랜치·메서드 커버리지가 20~45% 향상됐고, 일부 앱에서는 최신 코딩 에이전트보다 최대 15배 적은 토큰을 소비했다.
세 번째는 장애에 선제적으로 대응하고 애플리케이션 복원력을 앞당기는(shift-left) 용도다. IBM은 마이크로서비스, 데이터베이스·미들웨어 서비스, MELT 등 엔티티와 전문가의 암묵적 지식을 담은 지식 그래프를 정의하고, 관측성(observability) 기반으로 IT 스택과 소스코드를 아우르는 컨텍스트를 좁혀 장애의 근본 원인을 분석한다. 인스타나의 'I3'(지능형 장애 조사) 에이전트는 ITBench 기준으로 GPT-5.1을 쓴 ReAct 에이전트보다 최대 4.0배 나은 성능을 보였다.
다만 제미니 3 플래시를 쓰면 ReAct 에이전트 성능이 I3보다 17% 낮은 수준까지 좁혀졌으나 토큰은 1.6배 더 썼다. IBM은 이 방식을 소스코드로 확장해, 제미니 2.5 플래시 기반 코드 분석·버그 수정 에이전트가 문제 마이크로서비스를 찾는 데 3.0배, 버그 수정에 1.6배 더 나은 성능을 내면서 토큰은 각각 3.7배, 5.9배 적게 썼다고 밝혔다. 이 다중 에이전트 시스템은 IBM Think에서 'IBM 콘서트 플랫폼'의 일부로 공개됐고 사내 CIO 조직에서 시범 운영 중이다.
네 번째 영역은 중요 환경의 IT 컴플라이언스 현대화로, 알고리즘과 적응형 계획·오케스트레이션을 활용한다. 기업이 점점 복잡하고 파편화된 규제 요건에 직면해 통제·평가·개선 계획을 수작업으로 만드는 부담을 줄이기 위해, 여러 전문 에이전트가 복잡한 작업을 알고리즘적으로 분해해 컴플라이언스를 자동화한다는 구상이다. IBM은 이런 사례들을 근거로 LLM 규모만 키우기보다 에이전트 로직이라는 '지능형 안내자'를 결합하는 것이 기업 AI 도입 확장의 열쇠라고 강조했다.