Anthropic тайно сократила время кэширования Claude с часа до 5 минут
Компания Anthropic незаметно изменила TTL кэша с 1 часа до 5 минут в марте 2024 года, что привело к росту затрат на 17-25% для пользователей Claude Code.
Пользователи Claude Code столкнулись с неожиданным ростом расходов после того, как Anthropic тайно сократила время жизни кэша (TTL) с 1 часа до 5 минут в начале марта 2024 года. Анализ данных показал увеличение затрат на кэширование на 17-25% и рост потребления квоты для подписчиков.
Скрытые изменения в кэшировании
Детальный анализ 119,866 API-вызовов с двух независимых машин за период с января по апрель 2024 года выявил четкую картину изменений:
timeline
title Изменения TTL кэша Claude Code
section Январь 2024
Только 5-минутный кэш : До появления часового TTL
section Февраль-начало марта
Только часовой кэш : Стабильная работа 33+ дня
section 6-8 марта
Переходный период : Появление 5-минутного кэша
section Март-апрель
Доминирование 5-минутного кэша : Рост затрат до 25%
Финансовые последствия
Сравнение затрат по моделям показывает существенные различия:
| Модель | Период | Фактические затраты | При часовом TTL | Переплата | % роста |
|---|---|---|---|---|---|
| Claude Sonnet 4-6 | Март 2024 | $2,776 | $2,057 | $719 | 25.9% |
| Claude Opus 4-6 | Март 2024 | $4,627 | $3,428 | $1,198 | 25.9% |
| Общие затраты | 4 месяца | $9,269 | $7,687 | $1,582 | 17.1% |
Техническая сторона проблемы
Ключевые факторы, усугубляющие проблему:
- Соотношение стоимости: Запись в кэш в 12.5 раз дороже чтения
- Долгие сессии: Чем больше контекста кэшируется, тем дороже каждое истечение
- Активное использование: 220M токенов, записанных в 5-минутный кэш, сгенерировали 5.7B чтений
За 3-месячный период 220 миллионов токенов были записаны в 5-минутный кэш, хотя те же токены активно использовались и могли бы быть в часовом кэше.
Влияние на квоты пользователей
Помимо роста затрат, изменения затронули пользователей с подписками:
- Токены создания кэша засчитываются в квоту по полной ставке
- Токены чтения кэша значительно дешевле в плане квоты
- Многие пользователи Pro впервые столкнулись с исчерпанием 5-часовой квоты
Реакция сообщества
Пользователи отмечают несколько проблем:
- Отсутствие уведомлений об изменениях
- Неожиданный рост счетов
- Снижение эффективности длительных сессий кодирования
- Необходимость пересматривать рабочие процессы
Anthropic пока не прокомментировала ситуацию. Неясно, было ли изменение намеренным для снижения инфраструктурных затрат или это техническая регрессия. Данные четко показывают, что февраль 2024 года с часовым TTL был наиболее экономичным для пользователей периодом.