연구2025년 9월 28일 AM 10:00

딥시크, API 비용 절반으로 줄이는 '스파스 어텐션' 모델 공개

중국의 AI 연구 기업 딥시크(DeepSeek)가 인공지능 모델의 운영 비용을 획기적으로 낮출 수 있는 새로운 기술을 선보였다. 이 회사가 공개한 실험적 AI 모델은 '스파스 어텐션(sparse attention)' 기술을 활용해 긴 맥락을 처리할 때 발생하는 API 비용을 기존 대비 약 50% 수준으로 줄이는 데 성공했다.

스파스 어텐션은 AI 모델이 입력 데이터를 처리할 때 모든 정보를 동일한 비중으로 다루는 대신, 실제로 중요한 부분에만 주의를 기울이도록 설계된 최적화 기법이다. 기존 트랜스포머 기반 모델들이 입력된 모든 토큰 간의 관계를 계산하면서 연산량이 기하급수적으로 증가하는 문제를 겪었다면, 스파스 어텐션은 관련성 높은 데이터 세그먼트만 선택적으로 처리함으로써 불필요한 연산 오버헤드를 제거한다.

이번 모델은 특히 대량의 텍스트나 문서를 한 번에 처리해야 하는 긴 컨텍스트 윈도우 작업에서 뚜렷한 비용 절감 효과를 보인다. 법률 문서 분석, 대규모 코드베이스 검토, 장편 콘텐츠 요약 등 수만 개 이상의 토큰을 다루는 애플리케이션에서 추론 비용이 절반 가까이 줄어들면서, 그동안 비용 문제로 상용화가 어려웠던 서비스들의 경제성이 크게 개선될 전망이다.

딥시크의 이번 발표는 AI 업계가 성능 경쟁에서 효율성 경쟁으로 무게중심을 옮기고 있음을 보여주는 사례다. 최근 몇 년간 대형 언어 모델들은 파라미터 수를 늘리고 학습 데이터를 확장하며 성능 향상에 집중해왔지만, 이제는 동일한 성능을 더 적은 비용으로 구현하는 것이 새로운 기술적 도전 과제로 떠올랐다.

특히 OpenAI, 앤스로픽(Anthropic), 구글 등 주요 AI 기업들이 프리미엄 가격의 API 서비스를 운영하는 상황에서, 딥시크의 비용 절감 기술은 가격 경쟁력 측면에서 상당한 우위를 제공할 수 있다. 중국 기업들이 미국 주도의 AI 시장에서 기술적 차별화와 함께 경제적 접근성을 무기로 시장 점유율을 확대하려는 전략으로 해석된다.

업계 전문가들은 스파스 어텐션과 같은 최적화 기술이 AI의 대중화를 앞당기는 핵심 요소가 될 것으로 전망한다. 추론 비용 절감은 단순히 기업의 운영비를 줄이는 것을 넘어, 더 많은 개발자와 스타트업이 AI 기술에 접근할 수 있는 문턱을 낮춤으로써 혁신의 속도를 가속화할 수 있기 때문이다.

다만 딥시크는 이번 모델을 '실험적(experimental)' 단계로 분류하고 있어, 상용 서비스로의 전환 시점과 실제 성능 안정성에 대해서는 추가 검증이 필요한 상황이다. 그럼에도 비용 효율성을 중심으로 한 기술 혁신이 AI 산업의 새로운 경쟁 축으로 자리 잡고 있다는 점에서, 이번 발표는 업계 전반에 적지 않은 파장을 일으킬 것으로 보인다.

딥시크, API 비용 절반으로 줄이는 '스파스 어텐션' 모델 공개

관련 기사