메뉴
BL
r/artificial 9일 전

토큰 과금제 여파, 연간 예산 순삭에 MS도 클로드 내부 라이선스 취소

IMP
8/10
핵심 요약

AI 업계가 정액제에서 사용량 기반의 토큰 과금제로 전환하면서 기업들의 AI 예산이 수개월 만에 고갈되는 현상이 발생하고 있습니다. 우버는 2026년 AI 연간 예산을 4개월 만에 모두 소진했으며, 막대한 클라우드 자원을 보유한 Microsoft조차 비용 폭등을 감당하지 못해 내부 직원들을 위한 Anthropic 클로드 파일럿 프로그램을 전면 취소했습니다. 이는 기업용 AI 시장의 수익화 모델이 한계에 직면했으며, AI 공급자와 고객사 간의 비용 줄다리기가 향후 AI 수요 억제로 이어질 수 있음을 시사합니다.

번역된 본문

본문: skip to main | skip to sidebar Jonathan Low의 블로그 2026년 5월 18일 토큰 기반 AI 과금제 전환으로 연간 예산이 몇 달 만에 고갈되면서 Microsoft가 내부 Anthropic 라이선스를 취소하다

AI 생성자와 투자자에게 좋은 소식은 수익이 급증하면서 기술이 재정적으로 가치를 입증하기 시작했다는 것입니다. 나쁜 소식은 무엇일까요? 업계가 정액제 요금에서 생성된 코드의每一 줄마다 요금을 청구하는 토큰 기반 과금으로 전환하면서 비용이 너무 비싸져 연간 예산이 몇 달 만에 고갈되고 있다는 것입니다.

우버(Uber)는 직원들에게 2026년 전체 예산을 4개월 만에 모두 소진했다고 경고했습니다. 무한한 클라우드 컴퓨팅 자산을 보유한 Microsoft는 예상치 못한 막대한 비용 때문에 내부 직원들에게 Anthropic의 Claude 접근을 제공하던 프로그램을 취소했습니다.

이는 기술 산업이 투자금을 회수하고 수익을 극대화하기 위해 현금화를 시도하는 수준이 너무 높아서 생태계 파트너마저 철수하고 있음을 의미합니다. AI 기업들이 사용량을 죽이지 않으면서 일부 투자를 회수할 수 있도록 하는 타협점(modus vivendi)이 결국 도달할 것이라고 가정하는 것이 신중할 것입니다. 하지만 그것이 언제, 어떻게 마련될지는 아직 불분명합니다. 그때까지 공급자와 고객 간의 줄다리기는 일부 수요를 억제할 수 있습니다.

JL Blaze Trends Tech 보고서: 기업용 AI 골드러시가 매우 비싼 벽에 부딪혔습니다. 기업들은 수천 명의 직원에게 고급 AI 모델에 대한 무제한 액세스를 제공하는 것이 몇 달 만에 연간 예산을 태워버린다는 것을 깨닫고 있습니다. 공급자들은 예측 가능한 정액제 요금에서 벗어나 모든 프롬프트와 생성된 코드 줄에 대해 요금을 청구하는 비싼 토큰 기반 사용 모델로 전환하고 있습니다.

토큰 기반 과금으로의 전환은 심각한 예산 초과를 초래하고 있습니다. 우버는 회사가 단 4개월 만에 2026년 전체 AI 예산을 모두 소진했다고 경고하는 내부 메모를 보냈습니다. 미국 AI 소프트웨어 가격은 20%에서 37%까지 급등했습니다.

이러한 비용 현실은 Microsoft가 Claude Code에 대한 내부 라이선스 취소를 시작하고 직원들에게 AI 도구에 대한 액세스 권한을 부여했던 파일럿 프로그램을 종료하도록 강제했습니다. 무한한 클라우드 컴퓨팅 리소스를 보유한 Microsoft조차도 사용량 기준으로 타사 코딩 어시스턴트가 자체 직원에게 너무 비싸다고 결정할 때, 이는 하나의 선례가 됩니다.

기업용 AI 골드러시가 갑자기 매우 비싼 벽에 부딪혔습니다. 소프트웨어 산업 전반에 걸쳐 기업들은 수천 명의 직원에게 고급 AI 모델에 대한 무제한 액세스를 제공하는 것이 몇 달 만에 연간 예산을 태워버린다는 것을 깨닫고 있습니다. 공급자들은 예측 가능한 정액제 요금에서 벗어나 모든 프롬프트와 생성된 코드 줄에 대해 요금을 청구하는 비싼 토큰 기반 사용 모델로 전환하고 있습니다.

이러한 비용 현실은 Anthropic의 가장 큰 파트너 중 한 곳에서 주요 내부 방향 전환을 강제했습니다. Microsoft는 Claude Code에 대한 내부 라이선스 취소를 시작했으며, 개발자와 비기술직 직원들에게 AI 기반 프로그래밍 도구에 대한 액세스 권한을 부여했던 파일럿 프로그램을 갑자기 종료했습니다.

이 이니셔티브는 원래 2025년 12월에 시작되었습니다. 수천 명의 Microsoft 직원들이 워크플로를 가속화하기 위해 AI 어시스턴트를 실험하도록 초대받았습니다. 하지만 초기 테스트 단계의 열정은 기업 프로덕션 환경의 실용성과 빠르게 충돌했습니다. 회사는 공식적으로 Claude Code 파일럿 프로그램을 마무리하고, 일상 업무에 이 도구를 통합했던 직원들의 액세스 권한을 회수하고 있습니다.

소비자에게 기본적인 AI 액세스는 여전히 상대적으로 저렴합니다. 하지만 규모를 갖춘 고급 엔터프라이즈급 모델을 실행하는 비용은 급등했습니다. Tropic의 데이터에 따르면 최근 미국 AI 소프트웨어 가격은 20%에서 37% 사이로 급등했습니다.

토큰 경제가 예산을 태우다 Microsoft는 이러한 증가하는 API 비용에 타격을 입는 거대 기업이 결코 아닙니다. 토큰 기반 과금으로의 전환은 실리콘 밸리 전체에 심각한 예산 초과를 초래하고 있습니다. 우버의 CTO인 Praveen Neppalli Naga는 t

원문 보기
원문 보기 (영어)
skip to main | skip to sidebar A Blog by Jonathan Low May 18, 2026 Microsoft Cancels Internal Anthropic Licenses As Shift To Token-Based AI Billing Blows Up Annual Budgets In Months The good news for AI generators and investors is that the technology is beginning to prove out financially as revenues surge. The bad news? The industry's move from flat-rate fees to token-based billing that charges for every line of code generated has become so expensive that it is blowing up annual budgets in a matter of months. Uber has warned employees that it has burned through its entire 2026 budget in four months. Microsoft, which has infinite cloud-computing assets, has cancelled a program providing internal staff access to Anthropic's Claude because of the unexpectedly exorbitant cost. The implication is that the tech industry is trying to cash in in order to optimize its profits - and help pay for some of the investments it has made - to such an extent that even its ecosystem partners are pulling out. It is prudent to assume that a modus vivendi will eventually be reached that allows AI companies to recoup some of their investments without killing usage. But when that will be and how it will be engineered is not yet apparent. In the meantime, the push and pull between provider and customer could suppress some demand. JL Blaze Trends Tech reports : The enterprise AI gold rush hit a very expensive wall. Companies are realizing that giving thousands of employees unlimited access to advanced AI models is blowing through yearly budgets in a matter of months. Providers are moving away from predictable flat-rate fees, shifting to expensive token-based usage models that charge for every prompt and line of code generated. The shift toward token-based billing is causing intense budget overruns. Uber sent out an internal memo warning that the company burned through its entire 2026 AI budget in just four months . US AI software prices have jumped between 20% and 37%. That cost reality just forced Microsoft to begin canceling internal licenses for Claude Code, ending a pilot program that gave its staff access to the AI tool. When even Microsoft—a company with infinite cloud computing resources—decides a third-party coding assistant is too expensive for its own staff on a usage basis, it sets a precedent. The enterprise AI gold rush is suddenly hitting a very expensive wall. Across the software industry, companies are realizing that giving thousands of employees unlimited access to advanced AI models is blowing through yearly budgets in a matter of months. Providers are moving away from predictable flat-rate fees, shifting to expensive token-based usage models that charge for every prompt and line of code generated. That cost reality just forced a major internal pivot at one of Anthropic's biggest partners. Microsoft has begun canceling internal licenses for Claude Code, abruptly ending a pilot program that gave its developers and non-technical staff access to the AI-powered programming tool. The initiative originally kicked off in December 2025. Thousands of Microsoft employees were invited to experiment with the AI assistant to speed up their workflows. But the enthusiasm of that initial testing phase quickly collided with the friction of enterprise production viability. The company is officially concluding the Claude Code pilot program , pulling access from staff who had integrated the tool into their daily routines. Basic AI access remains relatively affordable for consumers. But the price of running advanced, enterprise-grade models at scale has surged. Data from Tropic shows that American AI software prices have jumped between 20% and 37% recently. The Token Economy Burns Through Budgets Microsoft is far from the only giant feeling the burn of these rising API costs. The shift toward token-based billing is causing intense budget overruns across Silicon Valley. Uber's CTO, Praveen Neppalli Naga, sent out an internal memo warning that the ride-hailing company burned through its entire 2026 AI budget in just four months . When you pay by the token, a few heavy users running complex code generation tasks can drain millions of dollars faster than finance departments can track them. Anthropic itself recently modified its enterprise billing framework for Claude models to reflect this new reality. And the pressure is coming from inside the house at Microsoft, too. The company's own code repository platform, GitHub, announced it is abandoning flat-rate plans in favor of usage-based billing . What the Death of Flat-Rate AI Means for Enterprise Software The cancellation of the Claude Code pilot at Microsoft is a direct signal that the experimental phase of enterprise AI is over. We are entering the optimization phase. For the last two years, companies threw unlimited money at AI tools just to see what would stick. Now, CFOs are looking at the token usage receipts. When even Microsoft—a company with effectively infinite cloud computing resources—decides that a third-party coding assistant is too expensive to license for its own staff on a usage basis, it sets a precedent for the rest of the industry. Software vendors that rely on wrapping OpenAI or Anthropic models will have to completely rethink their pricing tiers. If they stick to flat monthly fees, power users will bankrupt them. If they pass the usage costs directly to the customer, enterprise adoption will slow down significantly. Save And Share : 2 comments: Anonymous said... Apologies for language and anger in advance. Dear Frontier Providers, Screw you and your outrageous API pricing. I see as of about mid-April ‘26 all of you are implementing this. Looks like CARTEL price-fixing to me. Too bad government is in on it. May open source win. Also thank you to China, and can you manufacture affordable GPUs with high capacity VRAM? Tip: Don't sell any to data centers, only small users. PS- Apple: Can you make your Mac products output some reasonable tokens per second so they're actually useable in real life? And not 10 years from now. 🖕you all in advance. Sincerely, All the users the who understand we are being milked and ripped off by the frontier LLM, GPU, and compute providers. And those loosing their jobs due to AI cost savings. And those that understand that UBI is a lie (and the Elites will never give us a penny, only transfer everything we have to themselves). PS- China can you send over some good quality inexpensive Pitchforks and Torches? May 22, 2026 at 10:11 AM Anonymous said... Open source on local affordable hardware is the way. It's a shame to see America fall behind on true open research and open economic development in a race for profit. In the long run China has it right: society benefits from open models. May 22, 2026 at 10:48 AM Post a Comment Newer Post Older Post Home Subscribe via RSS Subscribe via Email As a Partner and Co-Founder of Predictiv and PredictivAsia, Jon specializes in management performance and organizational effectiveness for both domestic and international clients. He is an editor and author whose works include Invisible Advantage: How Intangilbles are Driving Business Performance . Learn more... contact jon@thelowdownblog.com View on Amazon Search This Blog Blog Archive Blog Archive May 17 - May 24 (22) May 10 - May 17 (27) May 3 - May 10 (18) April 26 - May 3 (17) April 19 - April 26 (8) April 12 - April 19 (22) April 5 - April 12 (26) March 29 - April 5 (29) March 22 - March 29 (30) March 15 - March 22 (30) March 8 - March 15 (27) March 1 - March 8 (24) February 22 - March 1 (27) February 15 - February 22 (22) February 8 - February 15 (24) February 1 - February 8 (22) January 25 - February 1 (21) January 18 - January 25 (30) January 11 - January 18 (30) January 4 - January 11 (21) December 28 - January 4 (19) December 21 - December 28 (11) December 14 - December 21 (23) December 7 - December 14 (28) November 30 - December 7 (27) November 23 -