코파일럿, 모델 사용량 최대 27배 과평가 전환
GitHub Copilot이 프리미엄 요청 소진을 9~27배 늘리는 멀티플라이어를 조용히 업데이트하며 사실상의 정가제로 전환됩니다. 6월 1일부터 도입되는 사용량 기반 과금은 단순한 가격 인상이 아니라, 그동안 기업들이 인프라 비용을 흡수해온 한계를 드러내는 지표입니다. 개발팀과 IT 부서는 모델별 사용량 가시성 부족과 리포트 없이 무분별하게 고성능 모델을 사용하던 관행을 즉각 재정비해야 합니다.
GitHub가 조용히 멀티플라이어 표를 업데이트한 것은 지속 불가능한 보조금 모델의 첫 번째 가시적 균열이다.
간단한 배경 설명: Copilot 요금제는 매월 '프리미엄 요청' 풀을 제공하며, 각 모델에 멀티플라이어가 적용되어 풀을 얼마나 빨리 소진할지를 결정한다. 최근까지 Opus 4.6은 3x였으나 지금은 27x로, Sonnet 4.6은 1x에서 9x로 변경되었다.
하지만 멀티플라이어 표는 증상일 뿐이다. 실제 문제는 AI 기업들이 컴퓨팅 비용과 사용자 지불액 사이의 차이를 계속 흡수해왔다는 점이다.
현재 Anthropic은 진짜 컴퓨팅 제약에 직면해 있다. Claude Code, 에이전트 워크플로, 긴 컨텍스트 세션은 단순 채팅 완성보다 사용자당 10100배 더 많은 토큰을 소모한다. 이를 지원할 인프라 구축에는 1824개월이 걸린다. 같은 기간 GitHub Copilot의 주당 컴퓨팅 비용은 1월 이후 거의 두 배로 증가했다. Microsoft와 Anthropic이 그 격차를 흡수해왔으나, 이제 그 흡수가 끝났다.
27x 멀티플라이어는 이제야 솔직한 가격에 가까워진 것이다.
수백만 명의 직원이 모델 수준 사용량 가시성이 없는 IT 부서에 의해 Copilot을 기업 혜택으로 받아왔다. 할당량 대시보드나 모델 거버넌스 없이 직원들은 코드 리뷰, 보일러플레이트, 한 줄 완성에 이르기까지 모든 곳에 Opus를 사용해왔다. 왜 최고 모델을 쓰지 않겠는가?
6월 1일 GitHub는 완전한 사용량 기반 청구로 전환한다. 멀티플라이어 인상은 경고 신호일 뿐이며, 그 다음에는 실제 달러 금액이 기업 카드에 청구되어, 아무도 통제하려 하지 않았던 개별 사용 패턴까지 추적될 것이다.
어떤 엔지니어링 매니저는 6월 초 어느 화요일에 AI 예산이 예측의 15배 초과된 이유를 재무팀에 설명해야 하는 매우 불편한 시간을 보내게 될 것이다.
모든 주요 제공업체가 동일한 플레이북을 실행 중이다. OpenAI, Anthropic, Cursor — 정액제 시대가 실시간으로 해체되고 있다. 지금 마련되는 가격 구조는 무거운 에이전트 사용량이 진짜 비용을 반영하도록 설계되어 있다. 팀의 워크플로가 프론티어 모델 접근을 사실상 무제한으로 간주하는 데 의존한다면, 그 가정에는 유통기한이 있으며 곧 만료된다.
무료 점심은 끝났다. 6월 1일 전에 기본 설정을 조정하라!