목록으로
인물2026년 6월 5일 AM 05:37

마이크로소프트, AI 성과는 기술 아닌 리더 결정이 가른다며 5대 교훈 공개

2년 전만 해도 AI를 둘러싼 모든 대화는 '이 기술이 정말 가치 있는 일을 할 수 있는가'라는 질문에서 시작했다. 이제 AI의 실효성은 입증됐고, 화두는 '이 전환을 어떻게 이끌 것인가'로 옮겨갔다. 마이크로소프트는 최근 AI 전환의 최전선에 있는 고객 250곳을 '코파일럿 서밋'이라는 포럼에 모았다. 가장 인상적이었던 점은 가장 어려운 과제들이 한결같이 같은 결론을 가리켰다는 것이다. 즉 AI의 성과는 기업이 사들이는 기술이 아니라 리더가 내리는 결정에서 나온다는 것이다.

첫째, AI에 대한 신뢰는 일반적이지 않고 구체적이다. 기술 전반에 대한 막연한 확신이 아니라 특정 시스템이 특정 작업을 해내리라는 믿음에서 신뢰가 생긴다. 트레버 노아는 한 세션에서 존스홉킨스의 암 연구를 가장 분명한 예로 들었다. 단일 데이터셋으로 학습해 유방암 환자의 불필요한 조직검사를 줄이는 일에만 집중하는 시스템으로, 시를 쓰거나 길을 안내하지 않는 그 구체성이 곧 신뢰의 근거가 된다고 했다. 반대 사례로는 깊이 파고들면 코드를 짜도록 유도할 수 있었던 허츠 고객서비스의 AI 에이전트를 들며, 경계가 없으면 신뢰의 근거도 없다고 말했다.

신뢰를 쌓는 세 가지 조건으로는 일관된 성능, 시스템이 어떻게 작동하는지에 대한 이해, 그리고 문제가 생겼을 때의 책임 규명이 꼽혔다. 노아는 사고 이후에도 사람들이 다시 비행기를 타는 이유가 낙관이 아니라 FAA 보고서와 잘못에 대한 공개적 책임이라고 짚으며, 에이전트가 콘텐츠 생성에서 행동 수행으로 옮겨가는 만큼 책임 체계는 실패 이후가 아니라 그 이전에 갖춰져 있어야 한다고 강조했다.

둘째, 비효율적인 지식노동은 재설계가 필요하다. 법률·금융·회계처럼 구조가 있어 보이는 분야조차 모호한 워크플로와 들쭉날쭉한 산출물로 돌아간다. 코파일럿·에이전트 플랫폼을 이끄는 찰스 라만나는 제조업을 바꾼 구조적 전환이 모든 지식노동 기능에 닥친다고 봤다. 측정 가능한 단계, 인간과 기계 노동 사이의 의도적 선택, 활동이 아닌 성과의 추적이 그것이다. 마이크로소프트의 인력 전환을 이끄는 케이티 조지는 자사 영업조직에 코파일럿을 처음 도입했을 때 기술이 아니라 접근 권한만 쥐여주고 일반 제품 출시처럼 다룬 탓에 도입률은 올라도 성과는 따라오지 않았다고 전했다.

셋째, 모델보다 시스템이 더 중요하다. 링크드인의 라이언 로슬란스키는 첫 도입 물결에서는 어떤 모델을 쓸지가 곧 일 자체였지만, 이내 모델만으로는 부족하며 데이터 접근·맥락·인프라처럼 모델을 둘러싼 장치가 그만큼 중요하다는 점이 분명해졌다고 말했다. 앞서가는 조직은 더 나은 모델을 찾는 것이 아니라 모델 주위에 시스템을 더 정교하게 쌓아 올리며, AI 역량은 조달이 아니라 건설 프로젝트에 가깝다는 것이다.

넷째, 토큰경제가 새로운 인력 계획이다. AI 도구가 처음 들어왔을 때 리더들은 이미 관리하던 IT 예산에 견줘 비용을 따졌지만, 토큰경제의 비교 대상은 같은 일을 사람이 할 때의 비용이다. 이제 모든 리더는 '이 일을 사람이 할 것인가, 에이전트가 할 것인가'를 품질·시간·비용에 걸쳐 판단해야 하며, 그 비용은 모델과 시스템이 좋아지며 빠르게 내려가 올해 든 비용이 내년이나 다음 분기와 달라질 수 있다.

뒤따르는 질문은 누구에게 토큰을 얼마나, 무슨 일에 배분할 것인가다. 인력을 관리하듯 같은 신중함과 절충, 성과에 대한 책임이 필요하다는 것이다. 대부분의 조직은 아직 이런 결정을 잘 내릴 인프라를 갖추지 못했으며, 지금 이를 구축하고 경제성이 바뀔 때마다 다시 조정하는 쪽이 토큰 비용을 고정된 숫자로 취급하는 곳보다 의미 있는 우위를 갖게 된다.

다섯째, 이제 기업용 소프트웨어는 존재할 자격을 증명해야 한다. 스냅에서 제품·성장을 이끌다 합류해 코파일럿 전반을 책임지는 제이컵 안드레우는 어쩔 수 없이 형편없는 도구를 쓰던 시대는 끝났다고 말했다. 2010년대 초 아이폰을 시작으로 소비자 제품의 경험 기준이 직장으로 넘어왔고, 사람들은 일상에서 겪은 훌륭한 AI의 기준을 그대로 업무에 가져온다. AI는 그 간극을 메우거나 실패하며, AI 투자를 소비자 수준의 잣대로 검증하는 조직이 다르게 구축하고 다르게 구매하게 된다.

AI인사이트 편집팀

이 기사는 AI 기술을 활용해 작성되었으며, 편집팀이 검수했습니다.

관련 기사