골드만·메타 출신 창업자, 아프리카 중동용 음성 AI 스타트업 세웠다
고객지원과 고객 서비스는 지금 음성 AI에서 가장 뜨거운 분야 가운데 하나다. 그러나 사람처럼 들리면서도 눈에 띄는 지연 없이 응답하는 제품을 만드는 일은 일부 시장에서 훨씬 더 어렵다. 주요 업체 대부분이 아프리카와 중동을 염두에 두고 만들어지지 않았기 때문이다.
이 공백을 메우려고 지난해 설립된 스타트업 에이텍스AI(AethexAI)가 4DX 벤처스가 주도한 프리시드 라운드에서 300만 달러를 유치했다. 엔자 캐피털, 돔 룸 펀드, 모조 벤처스, 스탠퍼드 GSB 26 펀드가 참여했고, 개인 투자자로는 스탠퍼드 교수진, 통신사 임원, 앤스로픽 소속 AI 연구자들이 이름을 올렸다.
회사는 바피(Vapi)나 라이브킷(LiveKit) 같은 기존 오케스트레이션 도구를 쓰는 대신, 목표 시장에서 쓰이는 영어·프랑스어·아랍어의 현지 방언을 처리하기 위해 자체 소형 모델과 오케스트레이션 계층을 처음부터 직접 구축했다. 또 기업이 기술을 시험하고 서비스를 신청할 수 있는 플랫폼과 개발자용 API·SDK를 함께 선보였다.
창업자는 마리아마 디알로와 아요올루와 오데무이와다. CEO 디알로는 골드만삭스에서 일한 뒤 YC 지원 스타트업 모델ML에 제품·성장 담당으로 합류했고, CTO 오데무이와는 칼텍을 졸업하고 메타에서 일하다 스탠퍼드 경영대학원에 진학한 뒤 회사를 공동 창업했다.
두 사람이 파악한 현지 사정은 녹록지 않았다. 이집트의 한 콜센터는 상당수 통화를 자동화했다가 결과가 나빠 시스템을 되돌렸고, 아프리카의 여러 지원센터는 적정 비용에 통화 자동화를 맡길 엔지니어를 찾아 채용하는 일이 늘 골칫거리라고 전했다.
오데무이와는 "이 지역에서 자동화된 통화의 지연과 끊김(jitter)은 터무니없는 수준이었다. 우리가 단순 오케스트레이터가 됐다면 지역 밖에 호스팅된 대형 모델을 써야 했을 테고 지연이 더 커졌을 것"이라며 "작동하려면 아주 작은 모델을 쓰고 모든 단계에서 지연을 줄여야 한다고 판단했다"고 말했다.
그래서 회사는 가장 큰 모델을 좇는 대신 작은 모델로 충분히 지연 문제를 풀 수 있다고 보고, 파라미터가 3억 개에서 17억 개에 이르는 자체 코라(Kora) 시리즈를 개발했다. 학습에는 콜센터 파트너의 익명 처리된 녹음을 썼고, 아프리카 전역의 라디오 방송국에 하드드라이브를 보내 추가 오디오 데이터를 모았다. 비용을 낮추려 대학생 기여자 네트워크를 꾸려 데이터를 주석 처리하고 현지 이름의 발음을 입혔다. 그 결과 현재 하루 1만 7,000건 넘는 통화를 처리한다고 회사는 밝혔다.
사업 측면에서는 음성 AI가 처음인 고객을 현장 시연과 워크숍으로 안내한다. 디알로는 "지금 우리는 작은 회사라 모두에게 모든 것을 해줄 수는 없다. 거래를 시작할 때 가장 중요한 용도 하나를 골라 달라고 한다"고 말했다. 현재 주요 용도는 채권 추심, 고객 활성화, 그리고 은행·통신사가 쓰는 본인확인 절차인 KYC(고객확인) 관련 통화다.
회사는 현지 시장을 맡을 포워드 디플로이드 엔지니어를 계약직으로 채용하고, 통신 연결을 처리할 통신사와 채널 파트너십을 맺고 있다. 이 지역에서는 꽂으면 바로 되는 방식이 통하지 않는다는 것이다. 4DX 벤처스 공동창업자 겸 매니징 파트너 월터 배두는 "아프리카와 중동 기업은 서구 기업보다 약 3배 많은 통화량을 처리한다. 음성이 여전히 고객 응대의 주된 채널이기 때문"이라며, 기존 시스템은 고성능 GPU 인프라와 표준 영어·유럽어 환경, 미국·유럽식 업무 흐름에 맞춰 만들어져 현지와 격차가 크다고 지적했다.