속보기술2025년 12월 20일 AM 05:54

구글, ‘Gemini 3 Flash’ 공개,“최첨단 지능을 더 빠르고 저렴하게”

구글이 2025년 12월 17일(현지시간) 차세대 AI 모델군 ‘Gemini 3’ 라인업을 확장하며 신형 모델 ‘Gemini 3 Flash’를 출시했다. 구글은 이번 모델이 속도(지연시간)·효율·비용 경쟁력을 앞세우면서도 ‘프론티어(최첨단)급’ 성능을 유지한다고 밝혔다.

구글은 “Gemini 3 Flash는 Gemini 3의 프로급(reasoning) 기반을 유지하면서 Flash급의 빠른 응답성과 비용 효율을 결합했다”고 설명했다. 특히 복잡한 작업에서는 더 오래 ‘생각’하도록 조절하면서도, 일반적인 트래픽 기준으로는 Gemini 2.5 Pro 대비 평균 토큰 사용량이 30% 적다고 덧붙였다.

성능 지표도 공개됐다. 구글에 따르면 Gemini 3 Flash는 GPQA Diamond 90.4%, Humanity’s Last Exam 33.7%(도구 미사용 기준)**을 기록했으며, 멀티모달 벤치마크인 **MMMU Pro에서는 81.2%로 Gemini 3 Pro와 유사한 수준을 보였다. 구글은 이 모델이 자사 이전 세대인 Gemini 2.5 Pro를 다수 벤치마크에서 앞선다고 강조했다.

개발자용 활용처도 전면에 내세웠다. 코딩 에이전트 역량을 평가하는 SWE-bench Verified에서 78%를 기록해, 2.5 시리즈뿐 아니라 Gemini 3 Pro보다도 높은 점수를 냈다는 게 구글 측 설명이다. 구글은 빠른 추론과 도구 사용, 멀티모달 분석을 바탕으로 영상 분석, 데이터 추출, 시각 질의응답(VQA) 같은 고빈도 업무에 적합하다고 밝혔다.

출시 범위는 광범위하다. Gemini 3 Flash는 이날부터 전 세계 수백만 명을 대상으로 순차 적용되며, 개발자는 Google AI Studio의 Gemini API, Gemini CLI, 새 에이전트 개발 플랫폼 ‘Google Antigravity’에서 이용할 수 있다. 기업 고객은 Vertex AI와 Gemini Enterprise를 통해 제공된다. 일반 이용자는 Gemini 앱과 검색의 AI Mode에서 접근 가능하다.

구글은 “Gemini 앱에서 Gemini 3 Flash가 기본 모델로 적용돼, 기존 2.5 Flash를 대체한다”며 “전 세계 Gemini 사용자들이 추가 비용 없이 Gemini 3 경험을 제공받게 된다”고 밝혔다. 또한 검색 AI Mode에도 기본 모델로 확대 적용해, 질문의 맥락을 세분화해 파악하고 웹의 실시간 정보 및 링크를 결합해 ‘조직화된 답변+즉시 실행 가능한 추천’을 제공하는 방향을 제시했다.

가격 정책도 공개됐다. 구글에 따르면 Gemini 3 Flash는 입력 100만 토큰당 0.50달러, 출력 100만 토큰당 3달러로 책정됐다. 오디오 입력은 입력 100만 토큰당 1달러로 별도 과금된다. 구글은 ‘Artificial Analysis’ 벤치마킹을 근거로 Gemini 2.5 Pro 대비 3배 빠르다고도 주장했다.

한편 구글은 Gemini 3 생태계가 빠르게 확장 중이라고 밝혔다. 지난달 공개된 Gemini 3 Pro와 Gemini 3 Deep Think 모드 출시 이후, API에서 하루 1조(1T) 토큰 이상을 처리하고 있다고 전했다. 또한 JetBrains, Bridgewater Associates, Figma 등 여러 기업이 Gemini 3 Flash를 활용해 업무 프로세스 개선에 나서고 있다고 소개했다.

구글은 “Gemini 3 Pro, Deep Think, Flash로 이어지는 모델군 확장으로 개발과 일상 작업 모두에서 더 빠른 차세대 AI 활용이 가능해질 것”이라고 밝혔다. 업계에선구글이 ‘고성능–저비용–초저지연’ 조합을전면에내세워, AI 모델경쟁의주도권을속도와운영비(추론비용) 영역으로한층끌어내리려는행보로해석한다.

구글, ‘Gemini 3 Flash’ 공개,“최첨단 지능을 더 빠르고 저렴하게”

관련 기사