마이크로소프트 리서치, AI를 인간 지능의 확장으로 보는 현상학 논문 공개
마이크로소프트 리서치가 현행 AI 시스템을 '인간 지능의 확장'으로 해석한 논문 'The Origins of Artificial Intelligence in Natural Intelligence'를 블로그에 공개했다. AI가 인간의 정신을 복제하기 때문이 아니라 인간 인지와 언어에 이미 자리 잡은 구조를 전제하고 확장하기 때문에 강력하다는 것이 골자다.
연구는 AI의 능력과 한계 양쪽을 같은 관점으로 설명한다. 현재 시스템은 에세이 작성, 코드 생성, 복잡한 개념 요약, 자연스러운 대화에서 두드러진 유창함을 보이지만, 변화 속에서도 객체를 안정적으로 추적하거나 익숙하지 않은 상황에서 구성적으로 추론하거나 진실과 그럴듯한 허구를 구분하는 일에는 여전히 어려움을 겪는다.
저자들은 Adam Frank·Marcelo Gleiser·Evan Thompson의 'The Blind Spot'과 딥마인드 연구자 Alexander Lerchner의 'The Abstraction Fallacy' 같은 학제 간 작업을 참고해, AI가 인간적 의미에서 지능을 갖추는지가 아니라 'AI 시스템이 인간 인지에 뿌리내린 구조에 의존하기 때문에 작동하는가'를 묻는다. 이 관점은 에드문트 후설의 현상학에서 출발한다.
인간의 지각은 감각 데이터의 수동적 수용이 아니라 변화 속에서도 안정적인 사물을 경험하는 과정이라는 것이 출발점이다. 컵은 시점이 바뀌어도 같은 컵으로, 멜로디는 개별 음이 흘러가도 같은 멜로디로 인식된다. 언어는 이러한 안정적 구조를 개념적 형태로 표현하면서 등장하며, 대규모 언어 모델은 인간의 글에서 이런 개념 관계의 통계를 학습한다.
같은 메커니즘이 환각 현상도 설명한다. 인간은 경험을 통해 기대와 믿음을 끊임없이 수정하지만 AI 시스템은 텍스트 내부의 패턴을 이어 갈 뿐이며, 의미와 진실을 정박시키는 세계와의 체험적 연관이 없다는 것이다. 논문은 이를 두고 유창함은 빠르게 좋아지지만 진정한 구성적 추론은 그만큼 빨리 따라오지 않는 'compositionality gap'으로 정리한다.
멀티모달 시스템도 비슷하다. 이미지에 정확한 라벨을 붙이면서도 객체와 부분에 대한 견고한 추론에는 실패하는 경향이 있다는 진단이다. 시각 패턴과 언어 사이의 상관관계를 학습할 뿐 시간 속에서 안정적인 객체를 지각하지는 않기에 익숙한 패턴 밖에서는 의외로 취약하다는 것이다.
이 관점은 AI 안전 논쟁의 좌표도 바꾼다. 논문은 '악성 초지능'에 대한 공포와 'AI는 별다른 위험이 없다'는 입장이 모두 현재 시스템의 본질을 오해한다고 본다. 즉각적인 위험은 AI가 인간적 의도를 갖기 때문이 아니라 세계에 대한 반성적 책임 없이 추론 패턴을 확장하기 때문에 생긴다는 진단이다.
실무 함의도 분명하다. 저자들은 업계에서 'harness'라 부르는 다층 안전장치로 모델 동작을 제약·검증·모니터링하는 흐름이 임시방편이 아니라 AI 아키텍처의 본질적 속성을 반영한다고 본다. 신뢰할 수 있는 동작은 모델이 아니라 시스템을 만드는 사람이 책임지는 일이며 그 책임은 모델에 위임될 수 없다는 결론이다.
연구진은 AI를 인간 지능의 라이벌로 오해하면 과신과 회의론 양쪽 모두 본질을 놓치게 된다고 정리한다. AI가 인간 인지와 경험에서 비롯된 구조 위에 서 있다는 사실을 인정할 때, 시스템을 어떻게 이해하고 통제하며 사용할지에 대한 책임이 여전히 인간에게 있다는 것이 마이크로소프트 리서치의 결론이다.