Пользователи Claude Code столкнулись с неожиданным ростом расходов после того, как Anthropic тайно сократила время жизни кэша (TTL) с 1 часа до 5 минут в начале марта 2024 года. Анализ данных показал увеличение затрат на кэширование на 17-25% и рост потребления квоты для подписчиков.

Скрытые изменения в кэшировании

⚠ Внимание
Изменения были внесены без уведомления пользователей, что привело к неожиданному росту расходов на API-вызовы.

Детальный анализ 119,866 API-вызовов с двух независимых машин за период с января по апрель 2024 года выявил четкую картину изменений:


timeline
    title Изменения TTL кэша Claude Code
    section Январь 2024
        Только 5-минутный кэш : До появления часового TTL
    section Февраль-начало марта
        Только часовой кэш : Стабильная работа 33+ дня
    section 6-8 марта
        Переходный период : Появление 5-минутного кэша
    section Март-апрель
        Доминирование 5-минутного кэша : Рост затрат до 25%

Финансовые последствия

Сравнение затрат по моделям показывает существенные различия:

МодельПериодФактические затратыПри часовом TTLПереплата% роста
Claude Sonnet 4-6Март 2024$2,776$2,057$71925.9%
Claude Opus 4-6Март 2024$4,627$3,428$1,19825.9%
Общие затраты4 месяца$9,269$7,687$1,58217.1%
ℹ Причина роста затрат
При 5-минутном TTL любая пауза в сессии дольше 5 минут приводит к полному истечению кэша. Следующий запрос требует повторной загрузки контекста как новое создание кэша по тарифу записи ($3.75-6.25/MTok), а не чтения ($0.30-0.50/MTok).

Техническая сторона проблемы

Ключевые факторы, усугубляющие проблему:

  • Соотношение стоимости: Запись в кэш в 12.5 раз дороже чтения
  • Долгие сессии: Чем больше контекста кэшируется, тем дороже каждое истечение
  • Активное использование: 220M токенов, записанных в 5-минутный кэш, сгенерировали 5.7B чтений

За 3-месячный период 220 миллионов токенов были записаны в 5-минутный кэш, хотя те же токены активно использовались и могли бы быть в часовом кэше.

📝 Практический пример
Разработчик работает над проектом с перерывами на обдумывание. При часовом кэше контекст сохраняется, при 5-минутном — каждые 6+ минут требуется полная перезагрузка контекста.

Влияние на квоты пользователей

Помимо роста затрат, изменения затронули пользователей с подписками:

  • Токены создания кэша засчитываются в квоту по полной ставке
  • Токены чтения кэша значительно дешевле в плане квоты
  • Многие пользователи Pro впервые столкнулись с исчерпанием 5-часовой квоты

Реакция сообщества

Пользователи отмечают несколько проблем:

  • Отсутствие уведомлений об изменениях
  • Неожиданный рост счетов
  • Снижение эффективности длительных сессий кодирования
  • Необходимость пересматривать рабочие процессы
💡 Рекомендация
Пользователям Claude Code стоит мониторить свои расходы на кэширование и адаптировать рабочие процессы под более короткие сессии без длительных пауз.

Anthropic пока не прокомментировала ситуацию. Неясно, было ли изменение намеренным для снижения инфраструктурных затрат или это техническая регрессия. Данные четко показывают, что февраль 2024 года с часовым TTL был наиболее экономичным для пользователей периодом.