오픈소스 AI 웨어러블 Omi, 화면·대화 24시간 캡처 후 실시간 요약… 30만 전문가 사용
BasedHardware가 공개한 오픈소스 프로젝트 Omi가 화면과 대화를 캡처해 실시간 전사하고, 요약·실행 항목 생성과 함께 보고 들은 모든 것을 기억하는 AI 채팅을 제공한다. 데스크톱·모바일·웨어러블에서 동작하며 전 코드가 오픈소스로 공개되어 있다. 30만 명 이상의 전문가가 사용 중이라고 프로젝트 측은 밝혔다.
설치는 간단한 명령어 한 줄로 macOS 앱을 빌드하고 클라우드 백엔드에 연결해 실행할 수 있도록 구성됐다. 환경 파일이나 자격 증명, 로컬 백엔드 없이 바로 사용 가능하며, 요구 사항은 macOS 14 이상, Xcode(Swift·코드 서명 포함), Node.js다. 전체 백엔드 스택을 함께 개발하려는 사용자는 Rust 설치와 환경 변수 설정을 거쳐 별도로 빌드할 수 있다.
아키텍처는 Omi 웨어러블, macOS 앱(Swift/Rust), 모바일 앱(Flutter)이 BLE 또는 HTTPS/WS로 Python 백엔드에 연결되는 구조다. 백엔드는 Listen REST, Pusher WebSocket, GPU 기반 VAD(음성 활동 감지)와 화자 분리(Diarizer), Deepgram STT, Firestore DB, Redis 캐시, LLM 모듈을 포함한다.
구성 요소는 macOS 앱(desktop/), 모바일 앱(app/), 백엔드 API(backend/, Python·FastAPI·Firebase), 펌웨어(omi/, nRF·Zephyr·C), Omi Glass(omiGlass/, ESP32-S3·C), SDK(React Native·Swift·Python), AI 페르소나(web/personas-open-source/, Next.js)로 분류된다.
앱 개발 가이드와 예제 앱(GitHub·Slack·OmiMentor), 오디오 스트리밍 앱, 커스텀 채팅 도구, 앱스토어 제출 지침이 함께 제공된다. API 레퍼런스는 메모리·대화·실행 항목을 위한 REST 엔드포인트를 포함하며, Python·Swift·React Native SDK와 MCP(Model Context Protocol) 서버 통합도 지원한다.
하드웨어 측면에서는 모바일 앱과 페어링되어 24시간 이상 연속 캡처가 가능한 오픈소스 AI 웨어러블이 제공된다. 사용자는 완성품 Omi를 구입하거나, ESP32-S3와 카메라·오디오를 탑재한 Omi Glass Dev Kit을 구매할 수 있다. 오픈소스 하드웨어 설계, 구매 가이드, 디바이스 제작과 펌웨어 플래싱, 자체 웨어러블 통합 방법, 하드웨어 사양도 공개되어 있다.
프로젝트는 MIT 라이선스로 배포된다. 기존의 폐쇄형 AI 비서 제품과 달리, 펌웨어부터 클라우드 백엔드, 모바일·데스크톱 앱, SDK까지 전체 스택을 사용자가 직접 구축·수정·배포할 수 있다는 점이 특징이다.