마이크로소프트 AI CEO 술레이만, 초지능 개발에 전력… 음성 전사 모델 MAI-Transcribe-1 공개
마이크로소프트의 초대 AI CEO 무스타파 술레이만(Mustafa Suleyman)이 초지능(superintelligence) 개발에 전력을 다하겠다고 선언했다. 술레이만은 더 버지와의 인터뷰에서 이번 전환을 약 9개월 전부터 준비해왔다고 밝혔다.
마이크로소프트는 3월 중순 대규모 조직 개편을 단행하며 기업용과 소비자용 팀을 코파일럿(Copilot) AI 산하로 통합했다. 이 과정에서 제이콥 안드레오(Jacob Andreou)가 통합 팀의 엔지니어링, 성장, 제품, 디자인을 총괄하는 수석부사장(EVP)으로 승진했고, 술레이만은 초지능 추구와 프론티어 AI 모델 개발에 집중할 수 있게 됐다.
술레이만은 초지능을 비즈니스 관점에서 정의했다. 그는 "초지능이란 수백만 기업이 의존하는 세계 최고 수준의 언어 모델이 실질적인 제품 가치를 제공할 수 있느냐의 문제"라며, 개발자, 기업, 소비자 모두를 위한 서비스 제공에 초점을 맞추겠다고 밝혔다.
이날 마이크로소프트는 새로운 음성 전사 모델 MAI-Transcribe-1을 공개했다. 술레이만에 따르면 이 모델은 기존 최고 수준 모델 대비 GPU 비용이 절반에 불과해 "큰 비용 절감"을 가져다준다.
MAI-Transcribe-1은 25개 언어로 회의 전사, 영상 자막 생성, 콜센터 통화 분석 등이 가능하다. 배경 소음, 저품질 오디오, 겹치는 음성 등 까다로운 녹음 환경에 대응하도록 설계됐으며, 사람이 큐레이션한 데이터와 기계 전사 데이터를 혼합해 학습했다.
이 모델은 기존 음성 및 이미지 생성 모델인 MAI-Voice-1, MAI-Image-2와 함께 마이크로소프트 파운드리(Microsoft Foundry)와 새로운 AI 플레이그라운드(AI Playground)를 통해 제공된다. 마이크로소프트에 따르면 이 모델들이 상업적으로 폭넓게 이용 가능한 것은 이번이 처음이다. MAI-Transcribe-1은 MP3, WAV, FLAC 형식을 지원한다.
술레이만은 이 모델의 성능을 10명으로 구성된 소규모 전담팀 덕분이라고 설명했다. 모델링 팀은 "관료주의에서 해방돼" 데이터 확보와 벤더 관리를 담당하는 지원팀의 도움을 받으며 개발에만 집중할 수 있었다고 밝혔다.
술레이만은 "모든 사람의 주머니에 세계 최고 수준의 AI 어시스턴트가 들어갈 것"이라며, 사용자에게 책임지고 사용자의 이익에 맞춰 작동하는 "인간 중심" AI를 목표로 하고 있다고 덧붙였다.