AI 생성 콘텐츠, 신규 웹사이트의 35% 차지… 인터넷을 "가짜 행복"으로 물들이다
임페리얼 칼리지 런던, 스탠퍼드 대학교, 인터넷 아카이브 소속 연구진이 공동으로 발표한 새로운 프리프린트 연구에 따르면, 2022년부터 2025년 사이에 생성된 신규 웹사이트의 약 35%가 AI로 생성되었거나 AI의 도움을 받아 제작된 것으로 나타났다. 2022년 ChatGPT 출시 이후 소셜 플랫폼에 AI 생성 글이 넘쳐난다는 체감은 이미 널리 퍼져 있었지만, 이번 연구는 이를 데이터로 뒷받침한 첫 대규모 분석이다.
연구팀은 AI 탐지를 위해 네 가지 접근법을 시도한 끝에 Pangram Labs의 도구를 채택했다. 이 도구가 가장 일관된 결과를 보였기 때문이다. 다만 연구진은 모든 AI 탐지 도구가 완벽하지는 않다는 점도 명시했다. 대표적인 웹사이트 표본을 구성하기 위해 인터넷 아카이브의 웨이백 머신(Wayback Machine)이 수집한 웹페이지 스냅샷을 활용했다.
연구에서 가장 주목할 만한 발견은 AI 콘텐츠의 인위적 긍정성이다. 감정 분석(sentiment analysis)을 통해 단어를 긍정·중립·부정으로 분류한 결과, AI 생성 또는 AI 보조 웹사이트의 평균 긍정 감정 점수는 비AI 웹사이트보다 107% 높은 것으로 확인되었다. 연구진은 이 현상을 기존 대규모 언어 모델(LLM)의 아첨적이고 지나치게 낙관적인 특성에서 비롯된 증상으로 해석했다.
AI 글쓰기 도구가 사용자에게 맞추려는 경향은 파급 효과를 낳아, 인터넷 전반의 글쓰기 톤을 더욱 달콤하고 인위적으로 만들고 있다. 이른바 "가짜 행복(fake-happy)" 현상이다.
또 다른 분석에서는 AI 생성 글이 고유한 아이디어와 다양한 관점의 폭을 줄이는지를 조사했다. 그 결과 AI 웹사이트는 의미적 유사성(semantic similarity) 테스트에서 인간 제작 웹사이트보다 약 33% 높은 점수를 기록해, AI가 인터넷의 이념적 다양성을 축소시키고 있음이 확인되었다.
그러나 연구진이 세운 모든 가설이 입증된 것은 아니다. 네 가지 이론은 확인되지 않았다. 특히 AI가 허위정보의 증가로 이어질 것이라는 예측은 데이터에 의해 뒷받침되지 않았다. AI 글이 외부 소스로의 링크를 포함하지 않을 것이라는 가설, 그리고 인간 글보다 문체적으로 더 획일적일 것이라는 가설도 증거로 확인되지 않았다.
AI 글이 표현하는 아이디어는 더 동질적이었지만, 글쓰기 스타일 자체가 평탄해졌다는 증거는 나오지 않았다. 이는 연구팀에게도 큰 놀라움이었다. 스탠퍼드 연구원 Maty Bohacek은 "팀 전원이 그것이 사실일 것으로 예상했지만, 이를 뒷받침할 유의미한 증거가 없었다"고 밝혔다.
연구 전 실시한 여론 조사에서도 유사한 결과가 나타났다. 대다수 응답자가 AI 글이 가짜 뉴스를 늘리고, 외부 링크를 줄이며, 획일적인 목소리를 가질 것으로 예상했지만, 연구 결과는 이러한 기대를 뒤집었다. Bohacek은 "사람들이 최악의 결과를 예상하는 경향이 있다는 점이 흥미롭다"고 말했다.
이번 연구는 AI가 인터넷에 미치는 영향에 대한 최종 결론이 아니라, 더 깊은 탐구를 위한 출발점이라고 연구진은 강조했다. Bohacek은 "우리는 단지 기반을 닦고 싶었다"고 설명하며, AI 슬롭(slop)의 영향에 대한 이 스냅샷이 매우 인간적인 통찰을 제공한다고 덧붙였다.
즉, 일이 어떻게 전개될지 예측하기 어렵다는 것이다. AI가 인터넷을 변화시키고 있는 것은 분명하지만, 그 변화의 방향은 우리의 직관과 항상 일치하지는 않는다.