메뉴
HN
Hacker News 23일 전

GPT-5.5, 공식 토큰 단가 2배 인상... 실제 부담은 최대 92% 증가

IMP
8/10
핵심 요약

새롭게 출시된 GPT-5.5 모델은 입력 및 출력 토큰 단가가 전버전 대비 2배로 인상되었습니다. 모델이 장문 프롬프트에 대해 더 짧은 답변을 생성하여 비용 상승이 일부 상쇄되지만, 실제 사용자 부담은 분석 결과 49~92% 증가한 것으로 나타났습니다. 특히 10K 토큰 미만의 짧은 프롬프트를 사용하는 사용자는 비용 절감 혜택을 누리지 못하고 요금 인상을 온전히 부담하게 되어 청구액 관리에 주의가 필요합니다.

번역된 본문

게시일: 2026년 5월 4일 / 작성자: Justin Summerville

GPT-5.5 가격 인상: 실제로 청구되는 비용은 얼마일까?

우리는 이전에 Claude Opus 모델에 대해 진행했던 비용 분석을 새로운 GPT-5.5 모델에 대해서도 동일하게 진행했습니다. GPT-5.5는 GPT-5.4에 비해 2배의 가격 인상을 적용하여 출시되었습니다. 입력 토큰(input token)은 백만 당 $2.50에서 $5.00로, 출력 토큰(output token)은 백만 당 $15에서 $30로 각각 인상되었습니다. 또한 OpenAI는 이 모델이 불필요하게 길게 답변하지 않고(less verbose), 동일한 작업에 대해 더 짧은 결과물을 생성한다고 언급했습니다.

Opus 4.7 분석 때와 마찬가지로, 우리는 GPT-5.4에서 GPT-5.5로 사용을 전환한 유저들의 데이터를 분석하여 실제 사용자 비용에 미치는 순수영향이 무엇인지 파악하고자 했습니다. 그 결과 4992%의 비용 증가를 관찰했습니다. 이러한 가격 인상은 장문 프롬프트에 대해 모델이 1934% 더 적은 출력 토큰을 생성하는 점에 의해 일부 상쇄됩니다.

분석 방법론: 동일한 전환 유저 코호트(Switcher Cohort) 방식 우리는 Opus 4.7 분석과 동일한 접근 방식을 사용했습니다. GPT-5.5 출시 전까지 요청 수 기준 최다 사용 모델이 GPT-5.4였다가, 이후 GPT-5.5를 최우선 모델로 전환한 사용자들을 식별했습니다. 이러한 '전환 유저 코호트'를 통해 여러 모델 버전에 걸쳐 동일한 사용자 기반을 대상으로 통제된 사전-사후 비교를 수행할 수 있었습니다. GPT-5.4와 5.5는 동일한 토크나이저(tokenizer) 제품군을 사용하므로, 토크나이저 차이로 인한 영향은 고려하지 않아도 됩니다. 즉, 동일한 사용자와 동일한 워크플로우, 오직 다른 모델 버전만을 직접적으로 비교하게 됩니다.

GPT-5.5는 불필요하게 긴 답변을 줄이지만, 장문 프롬프트에 한해서만 해당 OpenRouter의 일관된 토큰 집계 기준을 사용하여 완성된 결과물의 길이가 모델 간에 어떻게 변화했는지 측정했습니다:

프롬프트 크기 | 5.4 중간값(토큰 수) | 5.5 중간값(토큰 수) | 변화율

  • 2K 미만 | 121 | 129 | +7%
  • 2K – 10K | 140 | 213 | +52%
  • 10K – 25K | 211 | 143 | -32%
  • 25K – 50K | 185 | 150 | -19%
  • 50K – 128K | 188 | 136 | -28%
  • 128K 초과 | 215 | 143 | -34%

10K 토큰 이상의 프롬프트의 경우, GPT-5.5는 19~34% 더 적은 토큰을 생성합니다. 하지만 짧은 프롬프트에서는 패턴이 반전됩니다. 2K 미만의 프롬프트는 완성도가 대략 비슷한 길이를 유지하며, 2K-10K 범위에서는 오히려 52% 더 길게 생성됩니다.

실제 비용에 미치는 영향 전환 유저 코호트의 청구된 비용을 바탕으로, 백만 OpenRouter 토큰당 평균 비용을 계산했습니다. 이를 통해 프롬프트 길이에 따른 편차를 정규화하여 비용 효율성을 직접적으로 비교할 수 있었습니다.

프롬프트 크기 | 백만 OR 토큰당 평균 비용(5.4) | 백만 OR 토큰당 평균 비용(5.5) | 변화율

  • 2K 미만 | $4.89 | $9.37 | +92%
  • 2K – 10K | $2.25 | $3.81 | +69%
  • 10K – 25K | $1.42 | $2.15 | +51%
  • 25K – 50K | $1.02 | $1.65 | +62%
  • 50K – 128K | $0.74 | $1.10 | +49%
  • 128K 초과 | $0.71 | $1.31 | +85%

우리의 분석에 따르면 GPT-5.5의 실제 비용은 49%에서 92%까지 증가했습니다. 10K 토큰 이상의 장문 프롬프트의 경우, 출력 토큰 감소로 인해 비용 상승분이 일부 상쇄되었습니다. 반면 10K 미만의 짧은 프롬프트는 출력 토큰 감소 혜택을 받지 못해 비용 인상 폭이 더 크게 나타났습니다.

방법론 출처: OpenRouter의 요청 로그 코호트: 요청 수 기준 최우선 모델이 GPT-5.4였다가 GPT-5.5로 전환한 사용자 표본 크기: 텍스트 전용, 취소되지 않은 요청(5.4 및 5.5에 분포) 측정 기간: GPT-5.4(출시 전 2026년 4월 2123일); GPT-5.5(출시 후 4월 2528일, 출시일 제외) 정규화: 프롬프트 토큰 수 기준으로 그룹화된 백만 OpenRouter 토큰당 비용. OpenRouter는 OpenAI와 독립적으로 토큰을 계산하여 버전 간 일관된 기준선(Baseline)을 제공함. 통제 변수: 미디어(이미지, 파일, 오디오, 비디오), 취소된 요청, 0토큰 요청은 제외함

원문 보기
원문 보기 (영어)
Posts 5/4/2026 by Justin Summerville GPT-5.5 Price Increase: What It Actually Costs We replicated the cost analysis we did on Opus on the new GPT-5.5 model. GPT-5.5 launched with a 2x price increase over GPT-5.4: input tokens increased from $2.50/M to $5.00/M and output tokens from $15/M to $30/M. OpenAI has also noted that the model is less verbose, producing shorter completions for the same tasks. Just as we did with Opus 4.7 we wanted to know what is the net impact on costs to users by analyzing usage that shifted from GPT-5.4 to GPT-5.5. We observed cost increases between 49-92%. The price increase is mitigated by the model generating 19-34% fewer completion tokens for longer prompts. Methodology: Same Switcher Cohort Approach We used the same approach as our Opus 4.7 analysis. We identified users whose top model by request count was GPT-5.4 prior to the 5.5 launch, who then switched to GPT-5.5 as their top model. This "switcher cohort" gives us a controlled before-and-after comparison of the same user base across model versions. Since GPT-5.4 and 5.5 use the same tokenizer family, we don&#x27;t need to control for tokenizer differences. The comparison is direct: same users, same workflows, different model version. GPT-5.5 Is Less Verbose, But Only for Longer Prompts Using OpenRouter&#x27;s consistent token counts, we measured how completion lengths changed between models: Prompt Size Median Completion (5.4) Median Completion (5.5) Change < 2K tokens 121 129 +7% 2K – 10K 140 213 +52% 10K – 25K 211 143 -32% 25K – 50K 185 150 -19% 50K – 128K 188 136 -28% 128K+ 215 143 -34% For prompts above 10K tokens, GPT-5.5 produces 19-34% fewer tokens. For shorter prompts, the pattern reverses: under 2K tokens completions are roughly the same length, and in the 2K-10K range they are 52% longer. Actual Cost Impact Using billed costs from requests in the switcher cohort, we calculated the average cost per million OpenRouter tokens. This normalizes for prompt length, allowing a direct comparison of cost efficiency. Prompt Size Avg $/M OR Tokens (5.4) Avg $/M OR Tokens (5.5) Change < 2K tokens $4.89 $9.37 +92% 2K – 10K $2.25 $3.81 +69% 10K – 25K $1.42 $2.15 +51% 25K – 50K $1.02 $1.65 +62% 50K – 128K $0.74 $1.10 +49% 128K+ $0.71 $1.31 +85% Our analysis shows that GPT-5.5 actual costs increased 49% to 92%. Longer prompts, over 10k tokens, saw costs offset by shorter completions. Shorter prompts, under 10k, experience a higher cost increase where completions did not get shorter. Methodology Source : OpenRouter&#x27;s request logs Cohort : Users whose top model by request count was GPT-5.4, who then switched to GPT-5.5 as their top model Sample size : Text-only, non-cancelled requests split across 5.4 and 5.5 Windows : GPT-5.4: April 21-23, 2026 (pre-launch); GPT-5.5: April 25-28, 2026 (post-launch, launch day excluded) Normalization : Cost per million OpenRouter tokens, bucketed by prompt token count. OpenRouter counts tokens independently from OpenAI, providing a consistent baseline across model versions. Controls : Excluded media (images, files, audio, video), cancelled requests, and zero-token requests