목록으로
연구2026년 4월 2일 AM 02:38

H컴퍼니, 컴퓨터 사용 AI 모델 Holo3 공개… OSWorld 벤치마크 78.85%로 업계 최고 기록

H컴퍼니(Hcompany)가 데스크톱 컴퓨터 자율 조작 AI 모델 Holo3를 공개했다. 최상위 모델인 Holo3-122B-A10B는 업계 대표 벤치마크인 OSWorld-Verified에서 78.85%를 기록하며 새로운 최고 성능(state of the art)을 달성했다.

Holo3의 가장 큰 특징은 효율성이다. 전체 파라미터는 122B이지만 실제 활성 파라미터는 10B에 불과해, GPT 5.4나 Opus 4.6 같은 대규모 독점 모델 대비 훨씬 낮은 비용으로 운영할 수 있다. 모든 모델은 H컴퍼니의 추론 API를 통해 이용 가능하다.

오픈소스 측면에서도 주목할 만하다. 소형 버전인 Holo3-35B-A3B의 가중치가 허깅페이스에 Apache2 라이선스로 공개됐으며, 무료 추론 API 티어를 통해서도 접근할 수 있다.

Holo3의 성능을 이끈 핵심은 에이전틱 러닝 플라이휠(Agentic Learning Flywheel)이라 불리는 특수 훈련 파이프라인이다. 합성 내비게이션 데이터 생성, 도메인 외 증강, 큐레이션된 강화학습의 세 단계를 지속적으로 순환하며 인식(perception)과 의사결정(decision-making) 능력을 고도화한다.

실제 업무 환경에서의 성능을 검증하기 위해 H컴퍼니는 자체 평가 도구인 H 코퍼레이트 벤치마크(H Corporate Benchmarks)도 함께 공개했다. 이 벤치마크는 전자상거래, 비즈니스 소프트웨어, 협업 도구, 멀티앱 등 4개 카테고리에 걸친 486개 다단계 작업으로 구성돼 있다.

가장 난이도가 높은 멀티앱 영역에서는 에이전트가 PDF에서 장비 가격을 추출하고 각 직원의 잔여 예산과 대조한 뒤, 승인 또는 거부 이메일을 개별적으로 발송하는 등 여러 시스템을 동시에 조율하는 장기 워크플로를 수행해야 한다.

Holo3는 기반 모델인 Qwen3.5 대비 단일 애플리케이션 벤치마크에서 경쟁 모델들을 뛰어넘는 성과를 보였다. H컴퍼니는 이를 에이전틱 러닝 플라이휠의 효과를 입증하는 결과라고 설명했다.

H컴퍼니는 Holo3를 '자율 기업(Autonomous Enterprise)' 비전의 이정표로 위치시키며, 다음 단계로 적응형 에이전시(Adaptive Agency)를 예고했다. 이는 에이전트가 기존에 학습한 도구뿐 아니라 완전히 새로운 기업용 소프트웨어도 실시간으로 자율 학습하여 조작하는 것을 목표로 한다.

AI인사이트 편집팀

이 기사는 AI 기술을 활용해 작성되었으며, 편집팀이 검수했습니다.

관련 기사