월 $100 냈는데 1시간 만에 끝? 클로드 코드 토큰 초고속 소진 사태 정리

들어가며

요즘 개발자 커뮤니티에서 클로드 코드(Claude Code) 관련 불만이 심상치 않다. “분명히 Max 플랜 결제했는데 커피 한 잔 마시고 왔더니 할당량 소진”이라는 얘기가 여기저기서 터지고 있다.
나도 처음엔 내가 뭔가 잘못 쓴 건가 싶었는데, 알고 보니 이건 버그와 정책 변경이 겹친 구조적인 문제였다. 오늘은 팩트 위주로 무슨 일이 있었는지 정리해본다.

뭐가 문제였나, 프롬프트 캐시 TTL(Time To Live) 조용히 바꿨다

TTL(Time To Live)이란 캐시가 유효하게 살아있는 시간을 말한다. 쉽게 말해 “저장된 데이터를 얼마나 오래 재활용할 수 있냐”는 유통기한 같은 개념이다.

이번 사태의 핵심은 프롬프트 캐시(Prompt Cache)의 TTL(유효시간) 변경이다.

사용자 션 스완슨은 1월 11일부터 4월 11일까지 자신의 클로드 코드 세션 JSONL 파일을 직접 분석해서 깃허브에 버그 리포트를 제출했다. 그 내용이 꽤 충격적이다.

앤트로픽이 3월 초, 프롬프트 캐시 TTL 기본값을 1시간에서 5분으로 조용히 바꿨다는 것이다. 공지도 없이. 이 변경으로 인해 캐시 생성 비용이 20~32% 증가했고, 이전엔 할당량 제한에 걸린 적 없던 구독자들의 사용량이 급증했다.

어떻게 이게 토큰 폭증으로 이어지냐고? 프롬프트 캐시는 반복되는 컨텍스트(코드베이스 전체 로드, 대화 히스토리 등)를 저장해서 다음 요청에 재활용하는 최적화 기술이다.
근데 TTL이 5분밖에 안 되면 잠깐 자리를 비웠다 돌아오거나, 1시간 넘게 켜둔 세션을 이어서 쓰면 매번 전체 컨텍스트를 새로 읽어야 한다. 캐시 히트가 아니라 캐시 미스가 반복되는 구조다.

실제 피해 사례들

추상적인 얘기가 아니다. 실제로 이런 일들이 보고됐다.

  • 일반적인 질의응답과 간단한 개발 작업을 했을 뿐인데 1시간 30분 만에 할당량 소진
  • Pro 플랜 사용자 기준, 5시간 동안 프롬프트를 단 2회밖에 받지 못했다는 보고
  • 엔터프라이즈 팀 구독 사용자는 3월 마지막 주부터 2시간도 안 돼서 사고의 굴레(루프)에 빠지는 현상 반복
  • CI/CD 파이프라인에 클로드 코드를 연동한 경우, rate-limit 에러를 일반 실패로 오인한 재시도 로직이 작동하면서 하루 예산을 몇 분 만에 소진한 사례

월 $100짜리 Max 플랜 사용자가 1시간 만에 한도 소진, Pro 플랜 사용자가 한 달 30일 중 12일밖에 못 쓴다는 하소연까지 나왔다.

앤트로픽의 해명은?

클로드 코드 개발자 보리스 체르니는 몇 가지 입장을 내놨다.

첫째, “3월 6일 변경은 의도적인 최적화 작업이며 회귀 오류가 아니다”라고 했다. 오히려 “전체적으로 모든 요청 유형에 걸쳐 총 비용을 절감하는 효과가 있다”고 강조했는데, 이 부분은 사용자들이 체감하는 현실과 괴리가 크다는 반응이 지배적이다.

둘째, 기술적 배경 설명으로 “클로드 코드는 메인 에이전트에 1시간 프롬프트 캐시 창을 사용하므로, 컴퓨터를 1시간 이상 방치한 후 오래된 세션을 계속 사용하면 전체 캐시 미스가 자주 발생한다”고 밝혔다.

개선 방향으로는 기본 컨텍스트 창을 400K로 설정하고, 원하는 경우 최대 1M까지 구성하는 옵션을 검토 중이라고 했다. 또 많은 스킬을 동시에 사용하거나 다수의 에이전트를 돌릴 때 토큰이 급증할 수 있다는 점도 인정하면서, 사용자 경험 개선과 불필요한 토큰 사용 방지 작업을 진행 중이라고 덧붙였다.

앤트로픽 본사 역시 “사용자들이 예상보다 훨씬 빠르게 사용량 한도에 도달하고 있다”는 점을 인정하며 최우선 과제로 조사 중이라고 공식 입장을 냈다.

사용자들이 진짜 원하는 건

기술적 버그나 설명보다도, 사용자들이 지적하는 건 투명성의 문제다.

캐시 TTL을 바꿨으면 공지를 해야 했다. 사용량이 얼마나 남았는지, 어느 시점에 어떤 이유로 할당량이 줄어드는지 사용자가 예측 가능해야 한다. 현재는 사용자들이 자기 세션 파일을 리버스 엔지니어링해서 문제를 발견하는 구조인데, 이건 말이 안 된다.

AMD AI 책임자 스텔라 로렌조도 비슷한 문제를 지적했고, 사용자들 사이에서는 “비용을 사용자에게 전가하면서 투명성은 없다”는 불만이 확산되고 있다.

마무리

이번 클로드 코드 토큰 사태를 한 줄로 정리하면 이렇다. 기술적 버그 + 공지 없는 정책 변경 + 설명 부재의 삼중 콤보다.

AI 코딩 도구가 개발자 워크플로우의 핵심이 된 지금, 가격 모델의 예측 가능성과 투명성은 기능 못지않게 중요하다. 앤트로픽이 이번 사태에서 내놓는 후속 대응이 어떻게 되느냐에 따라, 클로드 코드가 진짜 프로 개발자의 도구로 자리 잡을 수 있을지가 결정될 것 같다.

나는 일단 세션 시작할 때 /status 명령어로 현재 사용량을 확인하는 습관을 들이고, 무거운 작업 전에는 /clear로 컨텍스트를 정리한 뒤 시작하는 방식으로 대응 중이다.

Copyright © 2026 Trtudio. All rights reserved.