메뉴
BL
r/ChatGPT 32일 전

코파일럿, 모델 사용량 최대 27배 과평가 전환

IMP
9/10
핵심 요약

GitHub Copilot이 프리미엄 요청 소진을 9~27배 늘리는 멀티플라이어를 조용히 업데이트하며 사실상의 정가제로 전환됩니다. 6월 1일부터 도입되는 사용량 기반 과금은 단순한 가격 인상이 아니라, 그동안 기업들이 인프라 비용을 흡수해온 한계를 드러내는 지표입니다. 개발팀과 IT 부서는 모델별 사용량 가시성 부족과 리포트 없이 무분별하게 고성능 모델을 사용하던 관행을 즉각 재정비해야 합니다.

번역된 본문

GitHub가 조용히 멀티플라이어 표를 업데이트한 것은 지속 불가능한 보조금 모델의 첫 번째 가시적 균열이다.

간단한 배경 설명: Copilot 요금제는 매월 '프리미엄 요청' 풀을 제공하며, 각 모델에 멀티플라이어가 적용되어 풀을 얼마나 빨리 소진할지를 결정한다. 최근까지 Opus 4.6은 3x였으나 지금은 27x로, Sonnet 4.6은 1x에서 9x로 변경되었다.

하지만 멀티플라이어 표는 증상일 뿐이다. 실제 문제는 AI 기업들이 컴퓨팅 비용과 사용자 지불액 사이의 차이를 계속 흡수해왔다는 점이다.

현재 Anthropic은 진짜 컴퓨팅 제약에 직면해 있다. Claude Code, 에이전트 워크플로, 긴 컨텍스트 세션은 단순 채팅 완성보다 사용자당 10100배 더 많은 토큰을 소모한다. 이를 지원할 인프라 구축에는 1824개월이 걸린다. 같은 기간 GitHub Copilot의 주당 컴퓨팅 비용은 1월 이후 거의 두 배로 증가했다. Microsoft와 Anthropic이 그 격차를 흡수해왔으나, 이제 그 흡수가 끝났다.

27x 멀티플라이어는 이제야 솔직한 가격에 가까워진 것이다.

수백만 명의 직원이 모델 수준 사용량 가시성이 없는 IT 부서에 의해 Copilot을 기업 혜택으로 받아왔다. 할당량 대시보드나 모델 거버넌스 없이 직원들은 코드 리뷰, 보일러플레이트, 한 줄 완성에 이르기까지 모든 곳에 Opus를 사용해왔다. 왜 최고 모델을 쓰지 않겠는가?

6월 1일 GitHub는 완전한 사용량 기반 청구로 전환한다. 멀티플라이어 인상은 경고 신호일 뿐이며, 그 다음에는 실제 달러 금액이 기업 카드에 청구되어, 아무도 통제하려 하지 않았던 개별 사용 패턴까지 추적될 것이다.

어떤 엔지니어링 매니저는 6월 초 어느 화요일에 AI 예산이 예측의 15배 초과된 이유를 재무팀에 설명해야 하는 매우 불편한 시간을 보내게 될 것이다.

모든 주요 제공업체가 동일한 플레이북을 실행 중이다. OpenAI, Anthropic, Cursor — 정액제 시대가 실시간으로 해체되고 있다. 지금 마련되는 가격 구조는 무거운 에이전트 사용량이 진짜 비용을 반영하도록 설계되어 있다. 팀의 워크플로가 프론티어 모델 접근을 사실상 무제한으로 간주하는 데 의존한다면, 그 가정에는 유통기한이 있으며 곧 만료된다.

무료 점심은 끝났다. 6월 1일 전에 기본 설정을 조정하라!

원문 보기
원문 보기 (영어)
The multiplier table GitHub quietly updated last week is the first visible crack in a subsidy model that was never sustainable. Quick context for anyone unfamiliar: Copilot plans give you a monthly pool of "premium requests." Each model has a multiplier that determines how fast you drain it. Until recently, Opus 4.6 had a 3x multiplier. It's now 27x. Sonnet 4.6 went from 1x to 9x. But the multiplier table is just the symptom. The actual disease is that the AI companies have been eating the difference between what compute costs and what you pay. Anthropic is genuinely compute-constrained right now. Claude Code, agentic workflows, long-context sessions, these eat 10-100x more tokens per user than a simple chat completion. The infrastructure to serve that demand takes 18-24 months to build. Meanwhile, week-over-week compute costs for GitHub Copilot nearly doubled since January. Microsoft and Anthropic have been absorbing that gap. They're done absorbing it. The 27x multiplier is closer to honest pricing. Millions of employees have Copilot provisioned as a corporate benefit by IT departments that have zero visibility into model-level consumption. No quota dashboard or model governance. Those employees have been running Opus on everything, code review, boilerplate, one-line completions because why wouldn't you use the best model? On June 1, GitHub moves to full usage-based billing, the multiplier hike is just the warning shot, what comes next is actual dollar charges hitting corporate cards, traced back to individual usage patterns that nobody thought to govern. Some engineering manager is going to have a very bad Tuesday in early June explaining to finance why the AI budget is 15x over forecast. Every major provider is running the same playbook right now. OpenAI, Anthropic, Cursor - the flat-rate era is being unwound in real time. The pricing structures being put in place now are designed to make heavy agentic usage reflect its true cost. If your team's workflow depends on treating frontier model access as essentially unlimited, that assumption has an expiration date and it's soon. The free lunch is over. Adjust your defaults before June 1!