목록으로
연구2026년 5월 5일 AM 12:04

GitHub 'fspecii/ace-step-ui' 트렌딩… ACE-Step 1.5 기반 오픈소스 Suno 대안 UI, 4분+ 풀송·BPM 60-200·Demucs 스템 분리·로컬 NVIDIA 4GB+ GPU 지원

오픈소스 GitHub 저장소 'fspecii/ace-step-ui'가 트렌딩에 올랐다. 이 프로젝트는 오픈소스 AI 음악 생성 모델 ACE-Step 1.5를 위한 'Spotify 스타일' 웹 UI로, 자체 GPU에서 로컬로 구동되는 Suno·Udio 대안을 표방한다. 저장소 소개에 따르면 Suno와 Udio가 월 10~50달러 구독료를 부과하는 반면, ACE-Step UI는 클라우드가 아닌 100% 로컬에서 무료로 동작하며 사용자가 결과물을 전적으로 소유하고 상업적 사용에도 제한이 없다.

음악 생성 측면에서는 보컬과 가사를 포함한 4분 이상 길이의 풀 송 생성, 보컬 없는 인스트루멘탈 모드, BPM·키·박자·길이를 직접 지정하는 커스텀 모드, 장르·무드·악기 등의 스타일 태그, 일괄 생성을 지원한다. AI Enhance 기능은 사용자의 태그를 BPM·키·박자가 포함된 상세 캡션으로 LLM이 보강해 주며, 생성 시간이 약 10~20초 늘어난다. 최고 품질을 노리는 'Thinking Mode'는 LLM이 곡 구조를 추론하고 오디오 코드를 생성하는 가장 느린 모드다.

후처리·편집 도구로는 임의 오디오 파일을 스타일 레퍼런스로 사용하는 Reference Audio, 기존 오디오를 새 스타일로 변환하는 Audio Cover, 트랙 일부 구간을 다시 생성하는 Repainting, 결과를 재현하기 위한 Seed Control, 품질·속도 트레이드오프를 조절하는 Inference Steps가 마련됐다. 가사 측면에서는 [Verse]·[Chorus] 등 구조 태그를 지원하는 가사 편집기와 AI 기반 캡션·가사 포맷 도우미, 장르 프리셋, 이전 생성 설정을 그대로 복제하는 Reuse Prompts 기능이 포함된다.

사용자 인터페이스는 다크·라이트 모드를 갖춘 Spotify 영감의 디자인을 채택하고, 파형과 진행 표시줄을 갖춘 하단 플레이어, 라이브러리 검색·정리, 좋아요와 커스텀 플레이리스트, 큐 위치가 표시되는 실시간 진행률, 동일 LAN 내 다른 기기에서의 접속을 지원한다. 후속 편집 기능으로는 AudioMass 기반 트림·페이드·이펙트, Demucs 기반 보컬·드럼·베이스·기타 스템 분리, Pexels 영상을 배경으로 활용하는 뮤직비디오 생성기, 인터넷 없이도 동작하는 그라디언트 앨범 커버 자동 생성이 제공된다.

기술 스택은 프런트엔드에 React 18·TypeScript·TailwindCSS·Vite, 백엔드에 Express.js와 better-sqlite3 기반 SQLite, AI 엔진은 ACE-Step 1.5를 Gradio API로 호출하는 구조다. 오디오 처리에는 AudioMass·Demucs·FFmpeg를 사용한다. 시스템 요건은 Node.js 18 이상, Python 3.10 이상(3.11 권장) 또는 Windows 포터블 패키지, NVIDIA GPU VRAM 4GB 이상(LLM 미사용 시) 또는 12GB 이상(LLM 사용 시 권장), Windows 포터블 패키지의 경우 CUDA 12.8, 그리고 FFmpeg와 표준 설치 시 권장 패키지 매니저 'uv'다.

설치 옵션은 세 가지다. Pinokio를 사용하면 Python·Node.js·의존성·모델 다운로드·실행이 클릭 한 번으로 자동화된다. Windows 포터블 패키지(약 5GB)는 python_embeded와 모든 의존성, CUDA 12.8을 포함하며 4GB GPU에서도 동작하지만 12GB 미만 GPU에서는 Thinking Mode가 자동 비활성화된다. 표준 설치 경로는 ACE-Step-1.5 저장소를 클론한 뒤 'uv venv'·'uv pip install -e .'로 가상환경을 만들고, ace-step-ui 저장소에서 setup.sh 또는 setup.bat을 실행하는 방식이다. 모델은 첫 실행 시 약 5GB가 자동 다운로드된다.

구동은 두 단계로 나뉜다. 먼저 ACE-Step Gradio 서버를 'uv run acestep --port 8001 --enable-api --backend pt --server-name 127.0.0.1' 명령으로 띄우고 'API endpoints enabled' 메시지를 확인한 뒤, 별도 터미널에서 ace-step-ui의 start.sh 또는 start.bat(Windows 포터블의 경우 start-all.bat)을 실행한다. 기본 접근 주소는 로컬 http://localhost:3000이며, 같은 네트워크의 다른 기기에서는 http://YOUR_IP:3000으로 접속할 수 있다. ACESTEP_PATH 환경 변수로 ACE-Step-1.5 디렉터리 위치를 지정할 수 있다.

환경 설정은 server/.env 파일에서 백엔드 PORT(기본 3001), ACESTEP_API_URL(ACE-Step Gradio가 띄워진 주소), DATABASE_PATH(로컬 SQLite 파일 경로), 영상 배경에 쓰이는 선택 사항인 PEXELS_API_KEY를 지정하는 방식으로 이뤄진다. 사용 시에는 'An upbeat pop song about summer adventures with catchy hooks' 같은 자연어 설명을 입력하는 빠른 모드와, 가사·스타일·길이(30~240초)·BPM(60~200)·키 등을 직접 지정하는 커스텀 모드를 선택할 수 있다.

AI인사이트 편집팀

이 기사는 AI 기술을 활용해 작성되었으며, 편집팀이 검수했습니다.

관련 기사