앤스로픽, 캐시 TTL을 1시간에서 5분으로 은밀히 축소
AI 개발자 커뮤니티에서 앤스로픽(Anthropic)이 3월 초 서버 측 업데이트를 통해 '클로드 코드(Claude Code)'의 프롬프트 캐시 유지 시간(TTL)을 기존 1시간에서 5분으로 임의로 축소했다는 의혹이 제기되었습니다. 이로 인해 캐시 재사용률이 급감하면서 사용자들의 API 사용량과 비용이 20~32%나 폭증하는 등 심각한 비용 문제가 발생하고 있습니다. 사전 공지나 클라이언트 업데이트 없이 서버 측에서 진행된 이 변경은 개발자들에게 직접적인 금전적 피해를 주고 있어 큰 논란이 예상됩니다.
공개 알림: 알림 설정을 변경하려면 로그인해야 합니다. 포크(Fork) 18.8k | 스타(Star) 113k
이슈: 2026년 3월 초순을 기준으로 캐시 TTL(Cache TTL)이 1시간(1h)에서 5분(5m)으로 임의로 퇴행(regressed)하여 사용량 할당량 및 비용이 급증했습니다. #46829 새 이슈 열기 | 링크 복사
라벨: api:anthropic, area:cost, 버그(bug: 작동하지 않는 문제), 재현 단계 있음(has repro: 상세한 재현 단계 포함)
설명: 작성자: seanGSISG | 개시일: 2026년 4월 12일
요약: 2026년 1월 11일부터 4월 11일까지의 원본 클로드 코드(Claude Code) 세션 JSONL 파일을 분석한 결과, 앤스로픽이 2026년 3월 초에 프롬프트 캐시 TTL 기본값을 1시간에서 5분으로 조용히 변경한 것으로 확인되었습니다.
이 변경 이전에 클로드 코드는 1시간 TTL 캐시 쓰기를 적용받고 있었으며, 이는 원래 의도된 기본값이었을 것으로 추정됩니다. 5분 TTL로의 회귀는 캐시 생성 비용을 20~32% 증가시켰으며, 이전에 한도에 도달한 적이 없던 구독 사용자들의 사용량 할당량(Quota) 소모가 눈에 띄게 급증하는 결과를 낳았습니다. 이는 이슈 #45756에 설명된 동작과 직접적으로 관련이 있는 것으로 보입니다.
데이터:
데이터는 2026년 1월 11일부터 4월 11일까지 두 대의 머신(Linux 워크스테이션 및 Windows 노트북, 서로 다른 계정 및 세션)에 걸쳐 총 119,866건의 API 호출을 추출하여 분석했습니다. 각 어시스턴트 메시지에는 usage.cache_creation.ephemeral_5m_input_tokens 및 ephemeral_1h_input_tokens의 세부 내역이 포함되어 있어, 호출 시 사용되는 TTL 등급(tier)을 명확하게 확인할 수 있습니다. 두 대의 독립적인 머신에서 동일한 날짜에 동일한 패턴의 변화가 나타났다는 점은 이 문제의 신뢰성을 더해줍니다.
단계별 분석(Phase breakdown):
1단계 (1월 11일 – 1월 31일) - 5분 전용 동작: ephemeral_1h가 없거나 0임 근거: API에서 1시간 등급이 아직 도입되지 않았을 가능성이 높음
2단계 (2월 1일 – 3월 5일) - 1시간 전용 동작: ephemeral_5m = 0, ephemeral_1h > 0 근거: 두 머신에서 33일 이상 연속적으로 1시간 등급만 사용됨. 거의 예외가 없었음
3단계 (3월 6일–7일) - 전환기(Transition) 동작: 처음으로 5분 토큰이 다시 등장하며 비율은 적지만 1시간 토큰도 여전히 존재함
4단계 (3월 8일 – 4월 11일) - 5분 주도 동작: 5분 토큰이 급증하여 대다수를 차지하고, 1시간 토큰은 소수로 전락하거나 완전히 사라짐
저희는 2단계가 앤스로픽의 원래 의도된 기본 동작이라고 확신합니다. 1시간 TTL은 2월 1일경 클로드 코드의 표준으로 도입되었고, 서로 다른 계정을 사용하는 두 대의 독립적인 머신에서 한 달 이상 일관되게 유지되었습니다. 1월의 모든 데이터가 5분이었던 것은 API에 1시간 TTL 등급이 도입되기 이전이었기 때문일 가능성이 가장 높습니다.
이 퇴행(regression)은 2026년 3월 6일에서 8일 사이에 시작되었습니다. 단계가 바뀌는 동안 클라이언트 측의 변경은 없었습니다. 동일한 클로드 코드 버전과 사용 패턴이 계속 유지되었습니다. TTL 등급은 앤스로픽의 서버 측에서 설정됩니다.
날짜별 TTL 데이터 (두 머신 합산, 퇴행 현상 확인):
| 날짜 | 5분(m) 생성 | 1시간(h) 생성 | 동작 |
|---|---|---|---|
| 2026-02-01 | 0.00M | 1.70M | 1시간 전용 ← 1시간 기본값 시작 |
| 2026-02-09 | 0.00M | 7.95M | 1시간 전용 |
| 2026-02-15 | 0.00M | 13.61M | 1시간 전용 ← 사용량이 가장 많은 날, 100% 1시간 |
| 2026-02-28 | 0.00M | 16.15M | 1시간 전용 ← 16M 토큰, 여전히 100% 1시간 |
| 2026-03-01 | 0.00M | 0.12M | 1시간 전용 |
| 2026-03-04 | 0.00M | 8.12M | 1시간 전용 |
| 2026-03-05 | 0.00M | 6.55M | 1시간 전용 ← 깔끔하게 1시간만 적용된 마지막 날 |
| 2026-03-06 | 0.29M | 0.22M | 혼합(MIXED) ← 5분 토큰이 처음으로 다시 등장 |
| 2026-03-07 | 4.56M | 0.50M | 혼합(MIXED) ← 5분 토큰 급증 |
| 2026-03-08 | 16.86M | 3.44M | 혼합(MIXED) ← 5분 토큰이 83%로 주도 |
| 2026-03-10 | 10.55M | 0.51M | 혼합(MIXED) |
| 2026-03-15 | 19.47M | 1.84M | 혼합(MIXED) |
| 2026-03-21 | 21.37M | 1.70M | 혼합(MIXED) ← 93%가 5분 |
| 2026-03-22 | 13.48M | 2.85M | 혼합(MIXED) |
이러한 전환은 일별로 명확하게 추적됩니다. 33일 동안 온전히 1시간만 적용되던 중 3월 6일에 처음으로 5분 토큰이 다시 나타났습니다. 3월 8일이 되자 5분 토큰이 1시간 토큰을 5:1 비율로 압도했습니다. 이는 서버 측 구성 변경이 점진적으로 롤아웃되다가 3월 8일경 완료된 것과 일치하는 양상입니다.
비용 영향 (Cost impact): 공식 앤스로픽 ... (원문 생략됨)