"신규 웹사이트 35%가 AI 생성" 연구 발표… 인터넷 콘텐츠 인위적 긍정 편향 확인
임페리얼 칼리지 런던, 스탠퍼드 대학교, 인터넷 아카이브 연구팀이 공동으로 발표한 새 프리프린트 논문에 따르면, 2022년부터 2025년 사이에 생성된 신규 웹사이트의 약 35%가 AI로 생성되었거나 AI 지원을 받은 것으로 나타났다.
이 연구는 2022년 ChatGPT 출시 이후 소셜 플랫폼을 중심으로 AI 생성 글이 급증했다는 관측에 데이터 근거를 제시한 것이다. 연구팀은 인터넷 아카이브의 웨이백 머신(Wayback Machine)이 수집한 웹페이지 스냅샷을 대표 표본으로 활용했으며, AI 탐지에는 Pangram Labs의 도구를 사용했다.
연구에서 특히 주목할 만한 결과는 AI가 인터넷 글의 톤에 미치는 영향이다. 감성 분석을 통해 단어를 긍정·중립·부정으로 분류한 결과, AI가 생성하거나 지원한 콘텐츠의 평균 긍정 감성 점수가 비AI 웹사이트보다 107% 높았다. 연구팀은 이를 기존 대형 언어모델(LLM)의 아첨적이고 지나치게 낙관적인 특성에서 비롯된 증상으로 분석했다.
AI는 또한 인터넷의 이념적 다양성을 줄이는 것으로 나타났다. AI 웹사이트는 의미적 유사성(semantic similarity) 테스트에서 사람이 만든 웹사이트보다 약 33% 높은 점수를 기록해, 독자적 아이디어와 다양한 관점의 범위가 줄어들고 있음을 보여줬다.
그러나 연구팀이 테스트한 6가지 가설 중 4가지는 확인되지 않았다. 특히 AI가 허위 정보의 증가로 이어질 것이라는 가설은 분석 결과 뒷받침되지 않았다. AI 글이 외부 소스로의 링크를 줄일 것이라는 예상과, 문체가 더 획일적일 것이라는 가설도 증거로 확인되지 않았다.
AI 콘텐츠가 표현하는 아이디어는 더 동질적이었지만, 글쓰기 스타일 자체가 획일화되었다는 증거는 없었다는 점이 연구팀에게도 의외였다. 스탠퍼드의 마티 보하체크(Maty Bohacek) 연구원은 "팀 전원이 그것이 사실일 것으로 예상했지만, 유의미한 증거를 확보하지 못했다"고 밝혔다.
연구팀은 분석 전 AI에 대한 대중 인식 설문조사도 실시했다. 그 결과 일반인 대다수도 연구팀과 마찬가지로 가짜 뉴스 증가, 외부 링크 감소, 문체 획일화를 예상했던 것으로 드러났다. 보하체크 연구원은 "사람들이 최악의 결과를 기대하는 경향이 있다는 점이 흥미롭다"고 말했다.
보하체크 연구원은 이번 연구를 더 심층적인 탐구의 출발점으로 보고 있다. 그는 "우리는 단지 첫 발을 내딛고 싶었다"며, AI 슬롭이 인터넷에 미치는 영향에 대한 향후 후속 연구의 필요성을 시사했다.