구글, Gemma 4 탑재 온디바이스 AI 앱 AI Edge Gallery 공개… 완전 오프라인에서 LLM 구동
구글이 스마트폰에서 대규모 언어 모델(LLM)을 완전히 오프라인으로 구동할 수 있는 앱 AI Edge Gallery를 공개했다. 이 앱은 구글 플레이와 앱스토어에서 내려받을 수 있으며, 최신 버전에서는 새롭게 출시된 Gemma 4 모델 계열을 공식 지원한다.
AI Edge Gallery는 세계에서 가장 강력한 오픈소스 LLM을 모바일 기기에서 직접 실행하는 것을 목표로 한다. 모든 모델 추론이 기기 하드웨어에서 이루어지기 때문에 인터넷 연결이 필요 없으며, 프롬프트와 이미지 등 민감한 데이터의 완전한 프라이버시가 보장된다.
이번 릴리스의 핵심인 Gemma 4는 고급 추론, 논리, 창의적 능력을 서버에 데이터를 전송하지 않고도 테스트할 수 있게 한다. 사고 모드(Thinking Mode)를 통해 모델의 단계별 추론 과정을 확인할 수 있으며, 현재 Gemma 4 계열 모델부터 지원된다.
앱은 8가지 주요 기능을 제공한다. 에이전트 스킬(Agent Skills)은 LLM을 단순 대화 도구에서 능동적 비서로 전환해, 위키피디아 기반 사실 확인, 인터랙티브 지도, 시각적 요약 카드 등의 도구를 활용할 수 있게 한다. 모듈형 스킬을 URL에서 불러오거나 GitHub Discussions의 커뮤니티 기여분을 탐색하는 것도 가능하다.
Ask Image 기능은 멀티모달 능력을 활용해 기기 카메라나 사진 갤러리로 물체를 식별하고 시각적 퍼즐을 풀거나 상세 설명을 제공한다. Audio Scribe는 음성 녹음을 실시간으로 텍스트로 변환하고 번역하는 온디바이스 기능이다.
프롬프트 랩(Prompt Lab)은 온도(temperature), top-k 등 모델 파라미터를 세밀하게 조절하며 다양한 프롬프트를 테스트할 수 있는 전용 작업 공간이다. 모바일 액션(Mobile Actions)은 FunctionGemma 270m 파인튜닝 모델을 사용해 완전 오프라인으로 기기 제어와 자동화 작업을 수행한다.
타이니 가든(Tiny Garden)은 자연어를 사용해 가상 정원에서 식물을 심고 수확하는 실험적 미니게임으로, 역시 FunctionGemma 270m 파인튜닝 모델로 구동된다. 모델 관리 및 벤치마크 기능을 통해 다양한 오픈소스 모델을 다운로드하거나 커스텀 모델을 불러와 특정 하드웨어에서의 성능을 테스트할 수 있다.
앱은 Android 12 이상과 iOS 17 이상을 지원하며, 구글 플레이 접근이 불가능한 사용자를 위해 APK 직접 설치도 제공한다. 해당 프로젝트는 깃허브에서 총 19,447개의 스타를 기록하고 있으며, 하루 만에 853개의 스타가 추가되는 등 개발자 커뮤니티의 높은 관심을 받고 있다. Apache License 2.0으로 공개되어 있다.