연구2026년 5월 12일 PM 03:37

전 OpenAI CTO의 싱킹 머신스, 0.4초 응답 풀듀플렉스 AI 공개

전 OpenAI 최고기술책임자(CTO) 미라 무라티(Mira Murati)가 작년 설립한 AI 스타트업 싱킹 머신스 랩(Thinking Machines Lab)이 월요일 "인터랙션 모델(interaction models)"이라는 새로운 개념을 발표했다. 본질적으로는 사람의 말을 중간에 끊고 들어올 수 있는 AI다.

지금까지 사용해본 모든 AI 모델은 같은 방식으로 동작했다. 사람이 말하면 AI는 듣기만 하고, AI가 응답하면 사람이 듣기만 한다. 입력과 출력이 순차적으로 번갈아 일어나는 구조다.

싱킹 머신스는 입력을 처리하면서 동시에 응답을 생성하는 모델을 만들어 이 구조를 바꾸려 한다. 회사는 이 방식이 문자 메시지를 주고받는 것이 아니라 전화 통화에 더 가까운 경험을 만든다고 설명한다.

기술 용어로는 "풀 듀플렉스(full duplex)"다. 회사는 자사 모델 TML-Interaction-Small이 0.40초 만에 응답한다고 밝혔다. 이는 사람의 자연스러운 대화 속도와 비슷한 수준이며, OpenAI와 구글의 비교 모델보다 훨씬 빠르다는 주장이다.

다만 이번 발표는 제품이 아닌 연구 프리뷰다. 회사는 아직 모델을 일반 공개하지 않았다. 향후 몇 달 내 "제한적 연구 프리뷰(limited research preview)"가 공개되고, 더 광범위한 출시는 올해 말로 예정돼 있다.

이를 어떻게 받아들여야 할지는 아직 불분명하다. 벤치마크 수치는 인상적이고, 상호작용성이 모델에 덧붙여진 기능이 아니라 본래부터 내재돼 있어야 한다는 핵심 아이디어도 분명 흥미롭다. 다만 실제 사용 경험이 기술적 주장에 부응할지는 사람들이 직접 써볼 수 있게 된 뒤에야 알 수 있다.

전 OpenAI CTO의 싱킹 머신스, 0.4초 응답 풀듀플렉스 AI 공개

관련 기사