AI 음악 생성 'ACE-Step UI' 깃허브 트렌딩… ACE-Step 1.5 기반 로컬 Suno 대안, 4분+ 풀 트랙·스템 분리·LAN 접속 지원
ACE-Step 1.5 기반 오픈소스 AI 음악 생성 인터페이스 'fspecii/ace-step-ui'가 깃허브 트렌딩에 올랐다. 누적 스타 1,382개, 당일 신규 +200 스타를 기록했다.
레포는 자신을 'The Ultimate Open Source Suno Alternative(궁극의 오픈소스 Suno 대안)'로 소개한다. 클라우드 기반 Suno·Udio가 월 $10~50를 청구하는 반면, ACE-Step UI는 사용자의 GPU에서 100% 로컬로 동작하며 비용은 무료다. 설치 이후 인터넷 연결도 필요하지 않다.
음악 생성 자체는 ACE-Step 1.5 모델이 담당하며, 보컬과 가사가 포함된 풀 트랙을 4분 이상 길이로 생성할 수 있다. 사용자는 가사를 [Verse]·[Chorus] 등 구조 태그와 함께 작성할 수 있고, 길이는 30~240초, BPM은 60~200 범위로 조정 가능하다.
모드는 세 단계로 구분된다. (1) AI Enhance OFF는 입력 스타일 태그를 모델에 그대로 전달해 가장 빠른 처리를 제공한다. (2) AI Enhance ON은 LLM이 태그를 상세 캡션·BPM·키·박자로 풀어주며 +10~20초 추가 시간이 든다. (3) Thinking Mode는 LLM이 곡 구조까지 추론하고 오디오 코드를 생성해 가장 느리지만 최고 품질을 노린다. Thinking Mode는 12GB 미만 VRAM 환경에서는 자동 비활성화된다.
UI는 Spotify 스타일을 표방한다. 다크·라이트 모드, 웨이브폼 표시 하단 플레이어, 라이브러리 검색·정리, 좋아요·플레이리스트, 실시간 생성 진행률에 더해 동일 LAN 내 다른 기기 접속(LAN Access)도 지원한다.
제작 보조 도구도 함께 들어간다. AudioMass 기반 오디오 에디터로 트림·페이드·이펙트 적용이 가능하고, Demucs로 보컬·드럼·베이스·기타 트랙을 스템 분리할 수 있다. Pexels 배경을 활용한 뮤직비디오 생성기와 인터넷 없이 만드는 그라디언트 앨범 커버 기능도 포함된다.
기술 스택은 프런트엔드가 React 18·TypeScript·TailwindCSS·Vite, 백엔드가 Express.js·SQLite·better-sqlite3, AI 엔진이 Gradio API를 통해 연결된 ACE-Step 1.5다. 오디오 툴은 AudioMass·Demucs·FFmpeg를 활용한다.
요구 사양은 Node.js 18 이상, Python 3.10 이상(3.11 권장), NVIDIA GPU VRAM 4GB 이상(LLM 미사용 시) 또는 12GB 이상 권장(LLM 사용 시), FFmpeg, 그리고 uv 패키지 매니저다. 윈도우용 Portable Package는 CUDA 12.8을 포함하고 ACE-Step-1.5.7z(약 5GB)을 풀어 설치하며, 모델 자체는 첫 실행 시 약 5GB가 자동 다운로드된다.
실행 시 ACE-Step Gradio는 8001 포트에서 API 엔드포인트를 노출하고, UI 백엔드는 3001 포트, 프런트엔드는 3000 포트에서 동작한다. 별도 설정 없이 한 번에 띄우는 'start-all' 스크립트(start-all.bat / start-all.sh)와, 무설치형 원클릭 도구 Pinokio를 통한 설치 옵션도 함께 제공된다.