엔비디아, 온디바이스 AI 에이전트용 윈도우 PC 'RTX 스파크' 공개
엔비디아가 컴퓨텍스에서 열린 GTC 타이베이에서 개인용 AI 에이전트를 위해 설계된 새로운 윈도우 PC 'RTX 스파크'를 공개했다. 동시에 RTX와 DGX 생태계 전반으로 로컬 에이전트를 확장하는 일련의 업데이트도 함께 내놨다.
개인 에이전트는 OpenClaw, Hermes 같은 오픈소스 프로젝트가 깃허브 개발자 커뮤니티에서 빠르게 채택되며 인기가 급격히 커지고 있다. 이들 에이전트는 앱과 상호작용하고 콘텐츠를 생성하며 반복 작업을 자동화하고 다단계 작업을 관리하는 일을 모두 기기 내에서 로컬로 실행한다.
RTX 스파크는 최대 1 페타플롭의 AI 연산 성능과 128GB 통합 메모리를 갖춰 온디바이스 에이전트의 처리 요구를 감당한다. 엔비디아는 슬림한 윈도우 노트북과 고효율 데스크톱을 겨냥했으며, 전문가용으로는 데이터센터급 GPU와 CPU 추론을 데스크톱에 담은 'DGX 스테이션 포 윈도우'도 함께 소개했다.
보안 측면에서는 마이크로소프트와 협력해 온디바이스 에이전트를 위한 윈도우 플랫폼을 마련했다. 아이덴티티·컨테인먼트·정책·종단간 보안을 제공하는 새 윈도우 보안 프리미티브와 엔비디아 'OpenShell' 런타임이 기반이다.
OpenShell은 사용자가 에이전트의 허용 범위를 정의하고, 프라이버시 정책에 따라 질의를 로컬 모델로 지능적으로 라우팅하며, 클라우드 모델로 보내는 질의에서 개인정보를 가리는 기능을 제공한다. Hermes Agent와 OpenClaw는 새 윈도우 앱에 OpenShell과 마이크로소프트 보안 프리미티브를 통합한다.
성능 면에서는 llama.cpp 커뮤니티와 협력해 멀티토큰 예측(MTP) 기법을 도입, Qwen 3.6과 3.5 27B에서 2배, 35B에서 1.6배 성능 향상을 달성했다. 이 최적화는 llama.cpp 웹UI와 LM 스튜디오에서 쓸 수 있다. 멀티GPU 환경에서는 llama.cpp가 텐서 병렬화로 동급 GPU 2개에서 메모리 최대 2배, 연산 1.8배를 내고, ComfyUI도 최대 2배 성능을 낸다.
엔비디아는 H 컴퍼니와 협력해 화면을 보고 마우스·키보드를 조작하는 컴퓨터 사용 도구를 RTX·DGX PC로 들여온다. H 컴퍼니의 'Holo Computer Use' 모델을 양자화하고 하니스를 가속해 엔비디아 GPU에서 2배 속도 향상과 메모리 사용량 35% 절감을 달성했으며, 모델은 지금 내려받을 수 있고 Holo 데스크톱 앱도 곧 제공된다.
리눅스 환경을 위해서는 DGX 스파크가 큰 메모리와 빠른 연산, CUDA 생태계 호환성을 묶은 가장 강력한 개인 에이전트용 컴퓨터로 제시됐다. 간소화된 NemoClaw 설치 관리자가 모든 RTX·DGX PC의 리눅스와 윈도우 서브시스템(WSL)에서 자동 샌드박싱과 Hermes Agent 지원을 제공한다. vLLM 최적화와 새 NVFP4 체크포인트로 Qwen 3.6 35B는 DGX 스파크에서 기존 Unsloth NVFP4 대비 2.6배 성능을 낸다.
엔비디아는 어도비와 함께 프리미어와 포토샵을 RTX 스파크용으로 재설계한다. Firefly 기반 생성형 채우기와 생성형 확장을 비롯한 도구들이 AI·편집·컬러·효과 작업에서 최대 2배 빨라진다. 블렌더의 DLSS 4.5 레이 리컨스트럭션, ComfyUI로 들어오는 RTX 비디오 프레임 생성 등은 올가을 RTX 스파크 출시와 함께 도입된다.