메뉴
HN
Hacker News 8일 전

마이크로소프트 보고서: AI가 인건비보다 더 비싸다

IMP
8/10
핵심 요약

글로벌 빅테크 기업들이 직원들의 AI 활용을 장려하며 생산성을 끌어올리려 하지만, 막대한 토큰 사용량으로 인해 오히려 인건비를 훨씬 웃도는 비용이 발생하는 역설적인 상황에 직면했습니다. 실제로 마이크로소프트는 엔지니어들의 클로드(Claude) 라이선스를 취소하고 내부 도구로 회유하는 등 AI 사용을 축소하고 있으며, 우버 역시 불과 4개월 만에 2026년 AI 코딩 도구 예산을 모두 소진했습니다. 기업의 AI 도입이 가속화될수록 토큰 소비량이 기하급수적으로 늘어, 단가가 하락하더라도 기업이 부담해야 할 총 AI 운영 비용은 더욱 폭증할 것이라는 게 업계의 공통된 지적입니다.

번역된 본문

오늘날 기업들은 AI 기술의 생산성 향상을 짜내기 위해 직원들에게 최대한 많은 AI를 사용하도록 압박하고 있습니다. 하지만 이러한 압박은 균열을 일으키고 있으며, 그 균열은 복구할 수 없을 정도일 수 있습니다.

The Verge에 따르면, 마이크로소프트는 엔지니어들을 GitHub Copilot CLI를 사용하도록 유도하면서 직접적인 Claude Code 라이선스 대부분을 취소하기 시작했다고 합니다. 이는 불과 6개월 전 수천 명의 개발자, 프로젝트 매니저, 디자이너 및 다른 직원들에게 코딩 실험을 장려하며 처음으로 Claude Code에 대한 접근을 열어둔 이후의 일입니다. 이 기술은 빠르게 인기를 얻었습니다. 어쩌면 너무 인기가 많았던 겁니다. 직원들이 이를 사용하는 규모가 너무 커서, 자체 엔지니어들이 의존하게 된 도구의 방향을 전환하도록 만들고 있습니다.

The Verge에 따르면, Claude Code 라이선스 취소는 마이크로소프트의 파운드리(Foundry) 거래에는 영향을 미치지 않습니다. 이 거래에는 Anthropic에 최대 50억 달러를 투자하고 파운드리 고객에게 Claude 모델에 대한 접근 권한을 제공하며, Anthropic이 Azure 컴퓨팅 용량을 구매하기 위해 300억 달러를 약정한 내용이 포함되어 있습니다.

AI 사용을 축소하는 기업은 마이크로소프트만이 아닙니다. 우버의 CTO 프라빈 네팔리 나가(Praveen Neppalli Naga)는 지난 4월 The Information과의 인터뷰에서 회사가 단 4개월 만에 2026년 AI 코딩 도구 예산 전액을 이미 모두 태워버렸다고 밝혔습니다. 이는 회사가 AI 도구 사용량을 기준으로 팀의 순위를 매기는 내부 리더보드를 통해 AI 도입을 적극적으로 장려한 이후에 일어난 일입니다.

이러한 보고서는 기술 최고 기업들이 이 기술에 걸고 있는 거대한 판돈에 찬물을 끼얹을 수 있습니다. 일부에서는 AI '르네상스'나 '혁명'이라는 약속에 매달리고 있지만, 도입 비용이 해결하기 어려운 병목 현상으로 입증되고 있습니다. 또한 이러한 변화는 인간의 노동을 AI로 대체하거나 보강하는 경제학이 일부 초기 예측에서 암시했던 것보다 훨씬 복잡할 수 있음을 시사합니다.

이는 엔비디아의 응용 딥러닝 부사장 브라이언 카탄자로(Bryan Catanzaro)가 최근 Axios와의 인터뷰에서 말한 내용과도 일맥상통합니다. "우리 팀의 경우 컴퓨팅 비용이 직원들의 인건비보다 훨씬 높습니다." 그는 이렇게 말했습니다. Anthropic과 마이크로소프트는 포춘(Fortune)의 코멘트 요청에 즉각적인 답변을 하지 않았습니다.

부상하는 AI의 역설: 더 저렴해진 토큰, 더 늘어난 청구서

우버와 마이크로소프트만이 직원들에게 최대한 많은 AI 사용을 강요하는 기업은 아닙니다. 우버처럼 한 메타(Meta) 직원은 가장 많은 AI를 사용하는 직원을 추적하기 위해 Anthropic의 AI 모델 이름을 딴 '클로드노믹스(Claudeonomics)'라는 리더보드를 만들었습니다. 아마존은 직원들에게 가능한 한 많은 AI 토큰(AI 컴퓨팅의 기본 구성 요소)을 사용하라는 의미의 '토큰맥스(tokenmaxx)'를 강요하고 있습니다.

하지만 토큰 기반 가격 책정 시스템을 채택할 경우, 사용량이 많아지고 효율성이 향상될수록 작업 비용은 더욱 비싸집니다. 골드만 삭스(Goldman Sachs)는 최근 에이전틱 AI(Agentic AI)가 소비자와 기업의 AI 에이전트 도입에 따라 2030년까지 토큰 소비를 24배 증가시켜 월 120경(quadrillion) 토큰이라는 엄청난 수치에 도달할 것으로 예측했습니다.

기업이 생산성을 높이기 위해 AI 에이전트에 의존하게 되면서, 개별 토큰의 가격이 하락하더라도 총 비용은 급격히 증가할 수 있습니다. 하지만 소비가 증가함에 따라 개별 AI 토큰의 비용은 급격히 떨어질 것으로 예상됩니다. 연구 기업 가트너(Gartner)의 최근 보고서에 따르면, 2030년까지 1조 개 매개변수를 가진 대규모 언어 모델(LLM, 즉 매우 정교한 AI 모델)에 대한 추론 비용은 AI 기업들에게 2025년보다 거의 90% 적게 들 것으로 나타났습니다.

그럼에도 불구하고 가트너는 토큰 가격의 하락이 기업용 AI 비용 감소로 이어지지는 않을 것이라고 예측했습니다. 왜냐하면 에이전틱 모델은 작업당 표준 모델보다 훨씬 더 많은 토큰을 요구하고, 증가된 소비가 하락하는 단위 비용의 속도를 앞지를 수 있으며, AI 제공업체들이 낮아진 비용을 소비자에게 온전히 전달하지는 않을 것이기 때문입니다. 결과적으로 추론 비용은 더 높아질 가능성이 큽니다.

가트너의 윌 소머(Will Sommer) 수석 애널리스트는 성명에서 "수석 제품 책임자(CPO)들은 대량의 토큰 가격 하락(디플레이션)을 최첨단 추론 기술의 민주화와 혼동해서는 안 된다"고 경고했습니다.

이러한 현실은 일부 기업들이 AI 에이전트를 배포하기 위한 거창한 계획을 복잡하게 만들 수 있습니다. 엔비디아의 젠슨 황(Jensen Huang) CEO는 최근 언젠가 100명의 AI 에이전트가 한 명의 직원을 위해 일하게 될 것이라고 말했습니다.

원문 보기
원문 보기 (영어)
Firms today are pushing employees to use as much AI as possible to squeeze out the technology’s productivity gains. But that pressure is leading to cracks, and those cracks may be irreparable. Recommended Video Microsoft has reportedly begun canceling most of its direct Claude Code licenses, according to The Verge , instead moving engineers toward using GitHub Copilot CLI. That comes just six months after the firm first opened up access to Claude Code, encouraging thousands of its developers, project managers, designers, and other employees to experiment with coding. The tech became popular fast. Perhaps too popular. The scale at which employees use it is now prompting the firm to reverse course on a tool its own engineers had come to rely on. Canceling Claude Code licenses won’t affect Microsoft’s Foundry deal, which includes investing up to $5 billion in Anthropic and giving Foundry customers access to Claude models, as well as Anthropic’s $30 billion commitment to purchase Azure compute capacity, according to The Verge . Microsoft isn’t the only company scaling back its internal AI use. Uber’s CTO Praveen Neppalli Naga told The Information in April that the firm had already burnt through its entire 2026 AI coding tools budget in just four months. That comes after the company had actively incentivized adoption through internal leaderboards ranking teams by AI tool usage. The reports may throw cold water on the bets tech’s biggest firms have placed on the technology. While some cling to the promise of an AI “renaissance” or “revolution,” the cost of adoption is proving a stubborn bottleneck. These developments also suggest that the economics of replacing or augmenting human labor with AI may be more complicated than some early forecasts originally implied. That echoes what Bryan Catanzaro , vice president of applied deep learning at Nvidia , recently said in an interview with Axios. “For my team, the cost of compute is far beyond the costs of the employees,” he said. Anthropic didn’t immediately respond to Fortune ’s request for comment. Microsoft didn’t provide a comment. An emerging AI paradox: cheaper tokens, bigger bills Uber and Microsoft aren’t the only firms pushing employees to use as much AI as possible. Like at Uber, a Meta employee crafted a leaderboard, fittingly named “ Claudeonomics ,” after Anthropic’s AI model, to track which workers are using the most AI. Amazon is pushing its employees to “ toxenmaxx ,” or use as many AI tokens as possible (the basic building blocks of AI compute). But with a token-based pricing system, the work gets more expensive with more use and better efficiency. Goldman Sachs recently forecasted that agentic AI could drive a 24-fold increase in token consumption by 2030 as consumers and enterprises adopt AI agents, reaching a staggering 120 quadrillion tokens per month. As businesses turn to AI agents to boost productivity, aggregate costs could rise sharply even if the price of each token falls. But as consumption increases, the cost of individual AI tokens is expected to fall sharply. A recent report from research firm Gartner found that by 2030, inference on a one-trillion-parameter LLM—in simple terms, a highly sophisticated AI model—will cost AI firms nearly 90% less than it did in 2025. Even so, Gartner predicted that cheaper tokens won’t translate to cheaper enterprise AI because agentic models require far more tokens per task than standard models, increased consumption can outpace falling unit costs, and AI providers won’t fully pass through lower costs to consumers. In turn, inference costs are likely to push higher. “Chief Product Officers (CPOs) should not confuse the deflation of commodity tokens with the democratization of frontier reasoning,” Gartner senior director analyst Will Sommer warned in a statement. That reality may complicate the grand plans some firms have for deploying AI agents. Nvidia CEO Jensen Huang recently said he thinks 100 AI agents will one day work alongside every employee at his company. Huang is part of a broader wave of CEOs touting an agentic future in which digital workers operate across the enterprise. But if token consumption rises faster than unit costs fall, that future could come with a much heavier bill than executives expect. In 2001, Fortune first convened the smartest people we know, bringing together CEOs and founders, builders and investors, thinkers and doers. Since then, Fortune Brainstorm Tech has been the place where bold ideas collide. From June 8–10 , we will return to Aspen —where it all began—to mark 25 years of Brainstorm. Register now .