마이크로소프트 보고서: AI가 인건비보다 더 비싸다
글로벌 빅테크 기업들이 직원들의 AI 활용을 장려하며 생산성을 끌어올리려 하지만, 막대한 토큰 사용량으로 인해 오히려 인건비를 훨씬 웃도는 비용이 발생하는 역설적인 상황에 직면했습니다. 실제로 마이크로소프트는 엔지니어들의 클로드(Claude) 라이선스를 취소하고 내부 도구로 회유하는 등 AI 사용을 축소하고 있으며, 우버 역시 불과 4개월 만에 2026년 AI 코딩 도구 예산을 모두 소진했습니다. 기업의 AI 도입이 가속화될수록 토큰 소비량이 기하급수적으로 늘어, 단가가 하락하더라도 기업이 부담해야 할 총 AI 운영 비용은 더욱 폭증할 것이라는 게 업계의 공통된 지적입니다.
오늘날 기업들은 AI 기술의 생산성 향상을 짜내기 위해 직원들에게 최대한 많은 AI를 사용하도록 압박하고 있습니다. 하지만 이러한 압박은 균열을 일으키고 있으며, 그 균열은 복구할 수 없을 정도일 수 있습니다.
The Verge에 따르면, 마이크로소프트는 엔지니어들을 GitHub Copilot CLI를 사용하도록 유도하면서 직접적인 Claude Code 라이선스 대부분을 취소하기 시작했다고 합니다. 이는 불과 6개월 전 수천 명의 개발자, 프로젝트 매니저, 디자이너 및 다른 직원들에게 코딩 실험을 장려하며 처음으로 Claude Code에 대한 접근을 열어둔 이후의 일입니다. 이 기술은 빠르게 인기를 얻었습니다. 어쩌면 너무 인기가 많았던 겁니다. 직원들이 이를 사용하는 규모가 너무 커서, 자체 엔지니어들이 의존하게 된 도구의 방향을 전환하도록 만들고 있습니다.
The Verge에 따르면, Claude Code 라이선스 취소는 마이크로소프트의 파운드리(Foundry) 거래에는 영향을 미치지 않습니다. 이 거래에는 Anthropic에 최대 50억 달러를 투자하고 파운드리 고객에게 Claude 모델에 대한 접근 권한을 제공하며, Anthropic이 Azure 컴퓨팅 용량을 구매하기 위해 300억 달러를 약정한 내용이 포함되어 있습니다.
AI 사용을 축소하는 기업은 마이크로소프트만이 아닙니다. 우버의 CTO 프라빈 네팔리 나가(Praveen Neppalli Naga)는 지난 4월 The Information과의 인터뷰에서 회사가 단 4개월 만에 2026년 AI 코딩 도구 예산 전액을 이미 모두 태워버렸다고 밝혔습니다. 이는 회사가 AI 도구 사용량을 기준으로 팀의 순위를 매기는 내부 리더보드를 통해 AI 도입을 적극적으로 장려한 이후에 일어난 일입니다.
이러한 보고서는 기술 최고 기업들이 이 기술에 걸고 있는 거대한 판돈에 찬물을 끼얹을 수 있습니다. 일부에서는 AI '르네상스'나 '혁명'이라는 약속에 매달리고 있지만, 도입 비용이 해결하기 어려운 병목 현상으로 입증되고 있습니다. 또한 이러한 변화는 인간의 노동을 AI로 대체하거나 보강하는 경제학이 일부 초기 예측에서 암시했던 것보다 훨씬 복잡할 수 있음을 시사합니다.
이는 엔비디아의 응용 딥러닝 부사장 브라이언 카탄자로(Bryan Catanzaro)가 최근 Axios와의 인터뷰에서 말한 내용과도 일맥상통합니다. "우리 팀의 경우 컴퓨팅 비용이 직원들의 인건비보다 훨씬 높습니다." 그는 이렇게 말했습니다. Anthropic과 마이크로소프트는 포춘(Fortune)의 코멘트 요청에 즉각적인 답변을 하지 않았습니다.
부상하는 AI의 역설: 더 저렴해진 토큰, 더 늘어난 청구서
우버와 마이크로소프트만이 직원들에게 최대한 많은 AI 사용을 강요하는 기업은 아닙니다. 우버처럼 한 메타(Meta) 직원은 가장 많은 AI를 사용하는 직원을 추적하기 위해 Anthropic의 AI 모델 이름을 딴 '클로드노믹스(Claudeonomics)'라는 리더보드를 만들었습니다. 아마존은 직원들에게 가능한 한 많은 AI 토큰(AI 컴퓨팅의 기본 구성 요소)을 사용하라는 의미의 '토큰맥스(tokenmaxx)'를 강요하고 있습니다.
하지만 토큰 기반 가격 책정 시스템을 채택할 경우, 사용량이 많아지고 효율성이 향상될수록 작업 비용은 더욱 비싸집니다. 골드만 삭스(Goldman Sachs)는 최근 에이전틱 AI(Agentic AI)가 소비자와 기업의 AI 에이전트 도입에 따라 2030년까지 토큰 소비를 24배 증가시켜 월 120경(quadrillion) 토큰이라는 엄청난 수치에 도달할 것으로 예측했습니다.
기업이 생산성을 높이기 위해 AI 에이전트에 의존하게 되면서, 개별 토큰의 가격이 하락하더라도 총 비용은 급격히 증가할 수 있습니다. 하지만 소비가 증가함에 따라 개별 AI 토큰의 비용은 급격히 떨어질 것으로 예상됩니다. 연구 기업 가트너(Gartner)의 최근 보고서에 따르면, 2030년까지 1조 개 매개변수를 가진 대규모 언어 모델(LLM, 즉 매우 정교한 AI 모델)에 대한 추론 비용은 AI 기업들에게 2025년보다 거의 90% 적게 들 것으로 나타났습니다.
그럼에도 불구하고 가트너는 토큰 가격의 하락이 기업용 AI 비용 감소로 이어지지는 않을 것이라고 예측했습니다. 왜냐하면 에이전틱 모델은 작업당 표준 모델보다 훨씬 더 많은 토큰을 요구하고, 증가된 소비가 하락하는 단위 비용의 속도를 앞지를 수 있으며, AI 제공업체들이 낮아진 비용을 소비자에게 온전히 전달하지는 않을 것이기 때문입니다. 결과적으로 추론 비용은 더 높아질 가능성이 큽니다.
가트너의 윌 소머(Will Sommer) 수석 애널리스트는 성명에서 "수석 제품 책임자(CPO)들은 대량의 토큰 가격 하락(디플레이션)을 최첨단 추론 기술의 민주화와 혼동해서는 안 된다"고 경고했습니다.
이러한 현실은 일부 기업들이 AI 에이전트를 배포하기 위한 거창한 계획을 복잡하게 만들 수 있습니다. 엔비디아의 젠슨 황(Jensen Huang) CEO는 최근 언젠가 100명의 AI 에이전트가 한 명의 직원을 위해 일하게 될 것이라고 말했습니다.