환각 막는 데이터 분석 AI 스타트업 프로바블리, 900만 달러 시드 유치
AI 환각(허위 생성)을 막겠다는 스타트업 프로바블리(Probably)가 앤드리슨 호로위츠(a16z)로부터 900만 달러 규모의 시드 투자를 유치했다. 대형 언어모델(LLM)이 강력해질수록 환각과 단순 사실 오류는 끈질기게 남는 문제였는데, 프로바블리는 이런 오류를 더 엄격하게 걸러내는 방식을 만들겠다는 목표다.
창업자 피터 일라이어스(Peter Elias)는 회사의 목표를 환각과 단순 사실 오류가 애초에 사용자에게 도달하지 못하게 막고, 결정론적 시스템에서 흔한 99.99% 수준의 정확도를 AI에서도 달성하는 것이라고 설명했다. 그는 LLM을 이 정도 정확도로 끌어올리려면 AI 엔지니어링의 기본 가정 상당수를 다시 생각해야 한다고 말했다.
프로바블리의 첫 제품은 복잡한 데이터셋에서 빠르게 답을 뽑아내는 데이터 과학 도구다. 각 결과에는 출처 인용과 그 답이 어떻게 도출됐는지 보여주는 감사 추적(audit trail)이 함께 붙는다. 이는 최근 AI 도구에서 점점 흔해지는 방식이다.
오류가 요약에 스며드는 것을 막기 위해 회사는 일라이어스가 '데이터 과학 메크 슈트'라고 부르는 정교한 하니스(harness) 시스템을 구축했다. LLM이 내놓은 1차 답변은 결정론적 검증기(validator)를 거치고, 데이터셋과 맞지 않는 결과는 되돌려 보내진다. LLM은 이 검증기에 맞춰 학습됐고, 시스템 전체가 빠르고 정확한 답을 내도록 최적화됐다고 회사는 설명했다.
일라이어스는 하니스 엔지니어링이 좋을수록 모델은 더 약해도 된다며, 맥락을 충분히 다듬으면 모델이 옳은 일을 하기 위해 크게 애쓸 필요가 없고 결국 모호함을 줄이는 작업이라고 말했다.
이 덕분에 프로바블리의 데이터 과학 도구는 훨씬 작은 AI 모델로 돌아간다. 일라이어스는 현재 버전이 프론티어 모델보다 네 단계 약한 모델에서 작동하며, 그래서 데이터센터가 아닌 데스크톱 같은 로컬 하드웨어에서도 구동할 수 있어 AI 사용에 따르는 토큰 비용을 크게 줄인다고 설명했다.
토큰 비용이 오르고 많은 고객이 AI 예산을 다시 들여다보는 시점에 반가운 접근이다. 일라이어스는 같은 엔진을 회계나 의료 서비스처럼 정밀함이 중요한 모든 분야로 확장할 수 있다고 봤다.
그는 대형 AI 연구소들이 이걸 시도조차 하지 않았다는 점이 흥미롭다며, 그들은 모델을 더 자주 교정해야 할수록 돈을 벌기 때문에 그렇게 할 동기가 없다고 덧붙였다.