메뉴
HN
Hacker News 32일 전

AI의 경제학은 성립하지 않는다

IMP
8/10
핵심 요약

마이크로소프트의 깃허브 코파일럿(GitHub Copilot)이 2026년부터 사용량 기반 과금제로 전환하며, 그동안 기업이 감당해온 AI 서비스의 막대한 적자 구조가 현실로 드러났습니다. 이는 할인된 요금으로 시장을 장악해 온 빅테크의 AI 보조금 정책이 한계에 달했음을 의미합니다. 향후 기업들은 폭등하는 연산 비용을 소비자에게 전가할 수밖에 없으며, 이는 전반적인 AI 산업의 가격 인상과 거품 붕괴로 이어질 핵심적인 변곡점입니다.

번역된 본문

이 글이 마음에 드셨다면, 프리미엄 뉴스레터를 구독해 주세요. 연간 70달러 또는 월 7달러이며, 매주 5,000단어에서 최대 18,000단어에 달하는 뉴스레터를 받아보실 수 있습니다. 여기에는 엔비디아(NVIDIA), 앤스로픽(Anthropic), 오픈AI(OpenAI)의 재무 상태와 AI 거품 전반에 대한 방대하고 상세한 분석이 포함되어 있습니다. 최근에는 시의적절하고 중요한 'SaaS 대파괴(SaaSpocalypse)를 위한 안티 가이드(Hater's Guide)', 'AI는 너무 커서 실패할 수 없다는 것은 틀렸다'는 주제의 글, 심도 있는(17,500단어 분량의) '오픈AI 안티 가이드', 그리고 지난주에는 방대한 분량의 '사모 신용(Private Credit) 안티 가이드'를 발행했습니다. 또한 오픈AI가 오라클(Oracle)을 어떻게 파멸시킬 것인지에 대한 글도 썼으며, 오늘 글에 그 자료 중 일부를 활용했습니다. 이는 제가 쓴 글 중 최고의 수작 중 하나이며 매우 자랑스럽게 생각합니다. 프리미엄 구독은 훌륭한 가성비를 제공할 뿐만 아니라, 매주 이렇게 방대하고 심층적으로 조사된 무료 글을 작성할 수 있게 해줍니다.

어제 아침, 깃허브 코파일럿 사용자들은 내가 일주일 전에 보도했던 사실에 대한 공식 확인을 받았습니다. 즉, 2026년 6월 1일부터 모든 깃허브 코파일럿 요금제가 사용량 기반 과금으로 전환된다는 것입니다. 마이크로소프트는 사용자에게 일정数量的인 '요청(requests)'을 제공하는 대신, 사용자가 사용하는 모델의 실제 비용을 기반으로 요금을 부과할 것입니다. 이들은 이를 "...모든 사용자를 위한 지속 가능하고 안정적인 코파일럿 비즈니스와 경험으로 나아가는 중요한 단계"라고 부릅니다. 대신 사용자는 깃허브 코파일럿 구독에 지출한 금액만큼의 토큰을 받게 됩니다 (예: 월 19달러 요금제인 경우 한 달에 19달러어치의 토큰). 이를 번역하자면 다음과 같습니다: "우리는 더 이상 깃허브 코파일럿 사용자들을 보조금으로 지원할 수 없습니다. 그렇지 않으면 에이미 후드(CFO)가 야구 방망이로 사람들을 때리기 시작할 겁니다."

아무튼, 이번 발표 자체는 향후 가격 변화가 어떻게 포장될 것인지에 대한 매우 흥미로운 예고편이었습니다. 코파일럿은 1년 전과 같은 제품이 아닙니다. 이제 인에디터 내 보조 도구에서 최신 모델을 사용하고 전체 리포지토리에 걸쳐 반복 작업을 수행하며 길고 다단계 코딩 세션을 실행할 수 있는 에이전트(Agentic) 플랫폼으로 진화했습니다. 에이전트 활용이 기본이 되고 있으며, 이는 컴퓨팅 및 인퍼런스(inference) 수요를 기하급수적으로 높입니다. 오늘날 간단한 채팅 질문과 몇 시간 동안 진행되는 자율 코딩 세션이 사용자에게 동일한 비용을 청구할 수 있습니다. 깃허브는 그 사용 뒤에 숨겨진 급증하는 인퍼런스 비용의 상당 부분을 흡수해 왔지만, 현재의 프리미엄 요청 모델은 더 이상 지속 가능하지 않습니다. 사용량 기반 과금은 이 문제를 해결합니다. 이는 가격 책정을 실제 사용량과 더 잘 일치시키고, 장기적인 서비스 안정성을 유지하는 데 도움이 되며, 헤비 유저를 제한할 필요성을 줄여줍니다.

보시다시피, 마이크로소프트가 거의 200만 명의 컴퓨팅 비용을 보조해주고 있었던 것이 아니라, AI가 너무 강력하고 복잡해져서 사실상 완전히 다른 제품이 되었다는 것입니다! 코파일럿이 "1년 전과 같은 제품이 아닐" 수도 있지만, 근본적인 경제적 불일치에 대해서는 거의 바뀐 것이 없습니다. 즉, 마이크로소프트는 3년 동안 사용자들이 매달 구독 비용보다 더 많은 토큰을 태우도록(사용하도록) 허용해 왔습니다. 2023년 10월 월스트리트 저널(WSJ)에 따르면: 개인 사용자는 이 AI 보조 도구에 대해 한 달에 10달러를 지불합니다. 올해 첫 몇 달 동안 이 회사는 사용자 1명당 평균 한 달에 20달러 이상의 손실을 보았으며, 일부 사용자는 회사에 한 달에 최대 80달러의 비용을 들인다고 해당 수치에 익숙한 한 관계자는 말했습니다.

당연히 깃허브 코파일럿 사용자들은 반발하며, 제품이 "죽었다"거나 "완전히 망가졌다"고 말하고 있습니다. 나는 2년 전 '서브프라임 AI 위기' 기사에서 이를 예측했습니다. 거의 전체 기술 산업이 빅테크에 의해 과도하게 할인되고 집중화되며 보조금이 지급된 기술에 매수되면서 일종의 서브프라임 AI 위기가 형성되고 있다고 나는 가정했습니다. 어느 시점에서 생성형 AI의 믿을 수 없고 맹독성적인 자금 소진 속도(burn-rate)가 그들에게 영향을 미칠 것이며, 이는 차례로 가격 인상으로 이어지거나 기업들이 터무니없이 가혹한 요금으로 새로운 제품과 기능을 출시하게 만들 것입니다. 예를 들어 세일즈포스(Salesforce)의 '에이전트포스(Agentforce)' 제품은 대화당 2달러라는 터무니없는 요금을 부과하여 예산을 써버릴 처지에 놓인 굳건한 기업 고객조차도 그 비용을 정당화할 수 없게 만들 것입니다. 그리고 바로 그날이 마침내 왔습니다. 왜냐하면...

원문 보기
원문 보기 (영어)
If you liked this piece, please subscribe to my premium newsletter. It’s $70 a year, or $7 a month, and in return you get a weekly newsletter that’s usually anywhere from 5,000 to 18,000 words, including vast, detailed analyses of NVIDIA , Anthropic and OpenAI’s finances , and the AI bubble writ large . I recently put out the timely and important Hater’s Guide To The SaaSpocalypse , another on How AI Isn't Too Big To Fail , a deep (17,500 word) Hater’s Guide To OpenAI , and just last week put out the massive Hater’s Guide To Private Credit . I also just did a piece about how OpenAI will kill Oracle , and I’ve used some of the materials in today’s piece. It's one of my best pieces I've ever done and I'm extremely proud of it. Subscribing to premium is both great value and makes it possible to write these large, deeply-researched free pieces every week. Yesterday morning, GitHub Copilot users got confirmation of something I’d reported a week ago — that all GitHub Copilot plans would move to usage-based pricing on June 1, 2026 . Instead of offering users a certain number of “ requests ,” Microsoft will now charge users based on the actual cost of the models they’re using, which it calls “...an important step toward a sustainable, reliable Copilot business and experience for all users.” Users instead get however much they spend on their GitHub Copilot subscription (EG: $19 of tokens a month on a $19-a-month plan). Translation : " we cannot continue to subsidize GitHub Copilot users, or Amy Hood will start hitting people with a baseball bat." Anyway, the announcement itself was a fascinating preview into how these price changes are going to get framed: Copilot is not the same product it was a year ago. It has evolved from an in-editor assistant into an agentic platform capable of running long, multi-step coding sessions, using the latest models, and iterating across entire repositories. Agentic usage is becoming the default, and it brings significantly higher compute and inference demands. Today, a quick chat question and a multi-hour autonomous coding session can cost the user the same amount. GitHub has absorbed much of the escalating inference cost behind that usage, but the current premium request model is no longer sustainable. Usage-based billing fixes that. It better aligns pricing with actual usage, helps us maintain long-term service reliability, and reduces the need to gate heavy users. You see, it’s not that Microsoft was subsidizing nearly two million people’s compute, it’s that AI has become so strong, powerful and complex that it’s basically a different product! While Copilot might not be “...the same product it was a year ago,” very little has changed about the underlying economic mismatch: that Microsoft was allowing users to burn more than their subscription costs in tokens every single month for three years. Per the Wall Street Journal in October 2023 : Individuals pay $10 a month for the AI assistant. In the first few months of this year, the company was losing on average more than $20 a month per user, according to a person familiar with the figures, who said some users were costing the company as much as $80 a month. Naturally, GitHub Copilot users are in revolt , saying that the product is “dead” and “completely ruined.” And I called it two years ago in the Subprime AI Crisis : I hypothesize a kind of subprime AI crisis is brewing, where almost the entire tech industry has bought in on a technology sold at a vastly-discounted rate, heavily-centralized and subsidized by big tech. At some point, the incredible, toxic burn-rate of generative AI is going to catch up with them, which in turn will lead to price increases, or companies releasing new products and features with wildly onerous rates — like the egregious $2-a-conversation rate for Salesforce’s “Agentforce” product — that will make even stalwart enterprise customers with budget to burn unable to justify the expense. And that day has finally arrived, because every single AI service you use subsidized compute , and every single service is losing money as a result: When you pay for access to an AI startup’s service — which, of course, includes OpenAI and Anthropic — you do so for a monthly fee, such as $20, $100 or $200-a-month in the case of Anthropic’s Claude , Perplexity’s $20 or $200-a-month plan , or OpenAI’s $8, $20, or $200-a-month subscriptions . In some enterprise use cases, you’re given “credits” for certain units of work, such as how Lovable allows users “100 monthly credits” in its $25-a-month subscription , as well as $25 (until the end of Q1 2026) of cloud hosting, with rollovers of credits between months. When you use these services, the company in question then pays for access to the AI models in question, either at a per-million-token rate to an AI lab, or (in the case of Anthropic and OpenAI) whatever cloud provider is renting them the GPUs to run the models. A token is basically ¾ of a word. As a user, you do not experience token burn, just the process of inputs and outputs. AI labs obfuscate the cost of services by using “tokens” or “messages” or 5-hour-rate limits with percentage gauges, and you, as the user, do not really know how much any of it costs. On the back end, AI startups are annihilating cash, with up until recently Anthropic allowing you to burn upwards of $8 in compute for every dollar of your subscription . OpenAI allows you to do the same, though it’s hard to gauge by how much. AI startups and hyperscalers assumed that they’d be able to get enough people through the door with subsidized, loss-making products to get them hooked on services badly enough that they’d refuse to change once businesses jacked up the prices. They also assumed, I imagine, that the cost of tokens would come down over time, versus what actually happened — while prices for some models might have come down, newer “reasoning” models burn way more tokens, which means the cost of inference has, somehow, gotten higher over time . Both assumptions were wrong, because the monthly subscription model does not make sense for any service connected to a Large Language Model. The Core Economics of Generative AI Are Broken Think of it like this. When Uber ( and no, this is nothing like Uber ) started jacking up the prices for its rides, the underlying economics stayed the same, as did those presented to both the rider and the driver — a user paid for a ride, a driver was paid for a ride. Drivers still paid for gas, car insurance, any permits that their local government might insist upon, and whatever financing costs might be associated with their vehicle, and said costs were not subsidized by Uber. Uber’s massive losses came from subsidies, endless marketing expenses, and doomed R&D efforts into things like driverless cars . Generative AI Subscriptions Are Nothing Like Uber To illustrate the scale of AI’s pricing mismatch, I’m going to ask you to imagine an alternate history where Uber had a very different business model. Generative AI subscriptions are like if Uber charged users $20 a month for 100 rides of any distance under 100 miles, and if gas was $150 a gallon, and Uber paid for the gas because somebody insisted that oil would one day be too cheap to meter . Uber would, eventually, decide to start charging users a monthly subscription to access rides, and bill them for the gas that they consumed. Suddenly users would go from paying $20 a month for 100 rides to paying $20 to access a driver and $26 for a 10 mile drive. Understandably, users would be a little upset. While this sounds a little dramatic, it’s actually a pretty accurate metaphor for what’s happening in the generative AI industry, and in particular, at Github Copilot. GitHub Copilot’s previous pricing allowed 300 premium requests a month, as well as “unlimited chat requests” using models like GPT-5 mini. Each of these requests (to quote Microsoft) is “...any interaction where you ask Copilot to do something for you,” wi