Gemma Gem, 구글 Gemma 4 모델을 브라우저에서 직접 구동하는 Chrome 확장 프로그램 공개
오픈소스 Chrome 확장 프로그램 Gemma Gem이 구글의 Gemma 4 모델을 WebGPU 기술로 브라우저 내에서 직접 구동하는 방식을 선보였다. API 키가 필요 없고, 클라우드에 데이터를 전송하지 않으며, 모든 AI 처리가 사용자의 기기에서 이루어진다.
Gemma Gem은 웹 페이지를 읽고, 버튼을 클릭하며, 폼을 작성하고, JavaScript를 실행하는 등 브라우저 내 다양한 작업을 수행할 수 있다. 방문 중인 사이트에 대한 질문에도 답변이 가능하다.
모델은 두 가지 크기를 지원한다. E2B 모델은 약 500MB, E4B 모델은 약 1.5GB의 디스크 공간이 필요하며, 첫 실행 후 캐시되어 이후에는 추가 다운로드 없이 즉시 사용할 수 있다.
실행 환경으로는 WebGPU를 지원하는 Chrome 브라우저가 필요하다. 개발자 모드에서 chrome://extensions 페이지를 통해 확장 프로그램을 로드하는 방식으로 설치한다.
기술 스택으로는 Chrome 확장 프레임워크 WXT, 브라우저 ML 추론을 위한 @huggingface/transformers, 마크다운 렌더링용 marked 라이브러리가 사용됐다. pnpm으로 빌드하며, 개발 빌드와 프로덕션 빌드를 구분해 제공한다.
사용자는 설정에서 Gemma 4 사고(thinking) 기능 활성화, 요청당 최대 도구 호출 횟수 제한, 대화 컨텍스트 초기화, 특정 사이트에서 확장 비활성화 등을 조절할 수 있다.
Gemma Gem은 클라우드 기반 AI 어시스턴트의 대안으로, 개인정보 보호가 중요한 환경에서 브라우저만으로 AI 기능을 활용할 수 있는 가능성을 보여준다. 온디바이스 AI가 데스크톱 앱을 넘어 브라우저 확장 프로그램 형태로도 실용화되고 있음을 시사한다.