목록으로
연구2026년 4월 26일 PM 07:17

MIT Tech Review 'DeepSeek V4가 중요한 3가지 이유'… 1M 토큰 컨텍스트 V4-Pro 27% 연산·10% 메모리, 화웨이 Ascend 950 대응

MIT 테크놀로지 리뷰는 24일(현지시간) 중국 AI 기업 DeepSeek가 금요일 공개한 새 플래그십 모델 V4 프리뷰의 의미를 정리한 분석 기사를 게재했다. 매체는 V4가 R1만큼 업계를 흔들 가능성은 낮다면서도, 이번 출시가 중요한 이유 세 가지를 짚었다.

V4는 V4-Pro와 V4-Flash 두 버전으로 공개됐고 양쪽 모두 추론 모드를 갖췄다. V4-Pro는 코딩과 복잡한 에이전트 작업용 대형 모델, V4-Flash는 더 빠르고 저렴한 소형 모델이다. DeepSeek가 책정한 V4-Pro 가격은 입력 100만 토큰당 1.74달러, 출력 100만 토큰당 3.48달러로 OpenAI·Anthropic 동급 모델 대비 일부에 불과하다. V4-Flash는 입력 0.14달러, 출력 0.28달러 수준으로 최상위급 모델 가운데 가장 저렴한 축에 속한다.

MIT 테크놀로지 리뷰가 꼽은 첫 번째 의미는 오픈소스 프론티어 모델로서의 도약이다. DeepSeek가 자체 공개한 벤치마크 결과에 따르면 V4-Pro는 Anthropic Claude-Opus-4.6, OpenAI GPT-5.4, Google Gemini-3.1과 견주는 성능을 보였고, 알리바바 Qwen-3.5나 Z.ai GLM-5.1 등 다른 오픈소스 모델은 코딩·수학·STEM 문제에서 모두 앞섰다. DeepSeek가 별도 공개한 기술 보고서에서 경험 많은 개발자 85명을 대상으로 한 내부 설문에서는 90% 이상이 코딩 작업에서 V4-Pro를 상위 선택지에 올렸다고 밝혔다.

두 번째 의미는 메모리 효율 기법의 진전이다. V4-Pro와 V4-Flash 모두 1백만 토큰 컨텍스트 창을 기본으로 지원한다. 이는 'The Lord of the Rings' 3부작과 'The Hobbit'을 합친 분량을 한 번에 처리할 수 있는 규모로, Gemini나 Claude의 최신 버전과 어깨를 나란히 한다. 핵심은 어텐션 메커니즘 재설계다. V4는 이전 텍스트를 동일하게 취급하지 않고 오래된 정보는 압축하고 현재 시점에서 중요한 부분에 선택적으로 집중하면서, 가까운 텍스트는 원본 그대로 유지해 세부 정보 손실을 막는다.

DeepSeek는 이 변화로 장기 컨텍스트 비용이 크게 줄었다고 설명했다. 1백만 토큰 컨텍스트 기준 V4-Pro는 직전 모델 V3.2 대비 연산력의 27%, 메모리의 10%만 사용한다. V4-Flash는 그보다 더 줄어든 연산 10%, 메모리 7% 수준이다. 이는 전체 코드베이스를 읽는 AI 코딩 어시스턴트나 긴 아카이브를 분석하는 리서치 에이전트처럼 방대한 자료를 다루는 도구를 더 저렴하게 구축할 수 있게 만든다.

세 번째이자 가장 정치적으로 무게가 실리는 의미는 엔비디아 의존에서 벗어나는 첫걸음이라는 점이다. V4는 DeepSeek가 화웨이 Ascend 등 중국산 칩을 우선 타깃으로 최적화한 첫 모델이다. 디 인포메이션은 이달 초 DeepSeek가 엔비디아·AMD 등 미국 칩 제조사에 V4 사전 접근을 제공하지 않았고 중국 칩 제조사에만 사전 접근권을 줬다고 보도했다. 신모델 출시 전 칩 제조사에 사전 접근을 허용해 지원을 최적화하는 일반적인 관행과는 거리가 멀다.

이에 호응해 화웨이는 금요일 Ascend 950 시리즈 기반 Ascend 슈퍼노드 제품군이 DeepSeek V4를 지원한다고 발표했다. 즉, 자체 수정한 V4를 운영하려는 기업과 개인은 화웨이 칩을 손쉽게 활용할 수 있게 된다. 로이터는 앞서 중국 정부 관리들이 DeepSeek에 학습 단계에서부터 화웨이 칩을 통합할 것을 권고했다고 보도한 바 있다.

MIT 테크놀로지 리뷰는 이런 흐름이 중국 산업 정책의 패턴과 맞물려 있다고 평가했다. 2022년부터 미국의 수출 통제로 중국 기업은 엔비디아의 최상위 칩에 접근할 수 없게 됐고, 이후 중국용 다운그레이드 버전 접근까지 추가로 제한됐다. 이에 베이징은 칩에서 소프트웨어 프레임워크, 데이터센터까지 자국 AI 스택 구축을 가속해 왔으며, 데이터센터와 공공 컴퓨팅 프로젝트에 자국 칩 사용 비중을 높이도록 압박해 온 것으로 알려졌다.

DeepSeek는 V4가 Claude Code, OpenClaw, CodeBuddy 등 인기 에이전트 프레임워크에 맞게 특별히 최적화됐다고 강조했다. 또한 매체는 V4가 R1 이후 가장 큰 의미를 갖는 출시이자, 인적 이탈과 이전 모델 출시 지연, 미·중 양국 정부의 강도 높은 관찰을 거친 뒤 프론티어 모델로 복귀하는 신호라고 평가했다.

AI인사이트 편집팀

이 기사는 AI 기술을 활용해 작성되었으며, 편집팀이 검수했습니다.

관련 기사