엔비디아 첫 에이전트 CPU '베라', 앤스로픽·OpenAI 등 4곳에 인도
엔비디아가 에이전트 AI 시대를 겨냥해 자체 설계한 첫 CPU '베라(Vera)'를 주요 고객사에 처음으로 인도했다. 지난 금요일 샌프란시스코의 앤스로픽, 미션베이의 OpenAI, 팔로알토의 SpaceXAI 등 세 곳의 AI 랩에 전달됐고, 이어 월요일에는 산타클라라의 오라클 클라우드 인프라스트럭처(OCI)에도 인도가 이뤄졌다.
베라는 엔비디아 CEO 젠슨 황이 지난 3월 산호세 GTC에서 발표한 차세대 CPU로, 회사가 '수십억 달러 규모의 다음 사업'으로 지목한 제품이다. 엔비디아가 자체 설계한 88개의 '올림푸스(Olympus)' 코어, 1.2TB/s 메모리 대역폭, 코어당 50% 빨라진 성능을 갖췄다.
첫 인도는 엔비디아 하이퍼스케일·고성능컴퓨팅 부문 부사장 이안 벅(Ian Buck)이 직접 현장을 돌며 손으로 전달하는 형태로 진행됐다. 벅은 "에이전트 AI는 AI 팩토리에 새로운 CPU 시대를 열고 있다. 모델이 답하는 단계에서 행동하는 단계로 넘어감에 따라, 베라는 그 작업을 대규모로 유지하도록 설계됐다"고 말했다.
첫 인도지는 샌프란시스코 소마(SoMa)의 앤스로픽 사무실이었다. 컴퓨트 책임자 제임스 브래드버리(James Bradbury)가 회의실에서 시스템을 인도받았으며, "컴퓨트 확장은 모델 성장의 중요한 가속제다. 베라가 에이전트 워크로드 해결의 유망한 한 축으로 부상하는 것을 기대한다"고 말했다.
두 번째 인도지는 OpenAI 미션베이 본사였다. 컴퓨트 인프라 책임자 사친 카티(Sachin Katti)가 본관 옆 야외 발코니에서 시스템을 받았고, 벅은 주머니에서 드라이버를 꺼내 케이스를 열어 내부 구조를 직접 보여줬다.
같은 날 마지막 인도지는 SpaceXAI의 팔로알토 사무실이었다. 일론 머스크가 직접 참여해 코어 수, 메모리 구조, 냉각 방식 등을 질문했다. SpaceXAI는 베라를 강화학습 워크로드와 학습 스택을 떠받치는 에이전트 기반 시뮬레이션 파이프라인에 적용하는 방안을 평가 중이다.
월요일에는 산타클라라의 오라클 AI 고객 우수 센터(Oracle AI Customer Excellence Center)에서 OCI 제품관리 총괄 카란 바타(Karan Batta)와 고객·파트너 성공 책임자 게리 밀러(Gary Miller)가 시스템을 둘러봤다. 바타는 "OCI는 2026년부터 수십만 개의 엔비디아 베라 CPU를 배포할 계획"이라며 "베라의 아키텍처는 고처리량 추론 워크로드를 위해 설계됐다"고 밝혔다. OCI는 베라를 하이퍼스케일 규모로 배포하는 첫 클라우드 사업자다.
베라는 엔비디아의 차세대 GPU '루빈(Rubin)', BlueField 4 DPU, Spectrum-X, MGX 랙 아키텍처와 함께 묶이는 '극단적 코디자인' 전략의 일부다. 통합 시스템 '베라 루빈 NVL72'에서는 2세대 NVLink-C2C로 루빈 GPU 두 개와 결합되며, 통합 메모리 아키텍처와 함께 기존 인프라 대비 2배의 에너지 효율을 제공한다고 엔비디아는 설명했다.