목록으로
제품2026년 5월 21일 AM 02:06

Stability AI, 6분 음악 만드는 'Stable Audio 3.0' 4종 공개

Stable Diffusion으로 알려진 Stability AI가 새 오디오 모델군 'Stable Audio 3.0'을 출시한다고 밝혔다. 최상위 모델은 6분 20초가 넘는 전문가급 음악을 만들 수 있다고 회사 측은 주장했다.

신규 모델은 small SFX(파라미터 4억 5,900만), small(4억 5,900만), medium(14억), large(27억) 네 가지다. small 모델 두 종은 최대 2분 길이의 사운드·음악을 디바이스에서 생성하기에 적합하다.

medium과 large 모델은 6분 20초 길이의 완성된 곡을 음악적 구조와 멜로디 톤을 유지하며 만들 수 있다. 2024년 공개된 Stable Audio 2.0이 만들던 길이의 두 배가 넘는다.

Stability AI는 small SFX, small, medium 세 모델을 오픈 가중치로 공개해 누구나 사용·수정할 수 있게 한다. 2024년 공개된 Stable Audio Open이 최대 47초까지만 만들 수 있었던 것에서 큰 진전이다.

가장 큰 large 모델은 API와 유료 셀프호스팅 서비스로만 제공된다. 매출 100만 달러를 넘는 기업은 별도의 엔터프라이즈 라이선스를 받아야 한다.

구글과 ElevenLabs를 비롯한 여러 기업이 음악 생성 모델과 도구를 내놓고 있다. 다만 Suno와 Udio의 법정 분쟁이 보여주듯 데이터 라이선싱과 음반 레이블과의 파트너십이 이런 서비스의 장기 생존에 핵심이 될 수 있다.

Stability AI는 지난해 Warner Music Group, Universal Music Group과 모델과 음악 창작 도구를 함께 개발하는 계약을 맺었다. 회사는 이번 오디오 모델군이 완전히 라이선싱된 데이터로 학습됐다고 밝혔다.

회사는 전문 음악가를 위한 새 제품군을 개발 중이지만 구체적 기능은 공개하지 않았다. Universal Audio와 Fender의 전 최고디지털책임자였던 Ethan Kaplan이 합류해 Stability의 전문 음악 사업을 이끈다.

다른 AI 기업들도 음악계 인사를 잇따라 영입하고 있다. Suno는 올해 초 전 Merlin CEO Jeremy Sirota를 최고상업책임자로 영입했고, ElevenLabs는 인디 음반 퍼블리셔 Kobalt 출신 Derek Cournoyer를 음악 사업 전략 리드로 데려왔다.

AI인사이트 편집팀

이 기사는 AI 기술을 활용해 작성되었으며, 편집팀이 검수했습니다.

관련 기사