Caveman: экономия 65–75% токенов в Claude Code — обзор инструмента

«Why use many token when few token do trick» — именно этим принципом руководствуется проект Caveman, превращая многословные ответы ИИ-агентов в чёткие, телеграфные команды.

Что такое Caveman и для кого он предназначен

Caveman — это скилл/плагин для Claude Code (а также Codex, Gemini, Cursor, Windsurf, Cline, Copilot и ещё 30+ агентов), который заставляет ИИ-агента отвечать в стиле пещерного человека — и тем самым сокращает ~75% выходных токенов, сохраняя полную техническую точность.

Проект создан Юлиусом Бруссе и быстро набрал популярность: репозиторий занял 1-е место в трендах GitHub почти с 5 000 звёздами и стал темой №1 для обсуждения на Hacker News.

Кому нужен Caveman:

  • Разработчикам, активно использующим Claude Code / Cursor / Windsurf
  • Командам, которые экономят на API-затратах
  • Всем, кто устал от «воды» в ответах ИИ и хочет скорость
ℹ Суть проблемы
Большинство выходных токенов в Claude Code — это не код, а нарратив: «Позвольте объяснить, что я собираюсь сделать», «Основываясь на проанализированном коде…». Caveman убирает всё это, оставляя только суть.

Как это работает

Ключевой механизм — удаление всего лингвистического наполнителя, который обычно генерируют языковые модели: артиклей («a», «an», «the»), приветствий вроде «I would be happy to» и хеджирующих фраз типа «it might be worth considering».

Caveman влияет только на выходные токены — токены мышления/рассуждения остаются нетронутыми. Мозг не становится меньше — только рот.

Пример трансформации ответа

До (стандартный режим):

"The reason your React component is re-rendering is likely because
you're creating a new object reference on each render cycle.
When you pass an inline object as a prop, React's shallow comparison
sees it as a different object every time, which triggers a re-render.
I'd recommend using useMemo to memoize the object."

После (Caveman mode):

"New object ref each render.
Inline object prop = new ref = re-render.
Wrap in useMemo."

Та же информация — примерно на 65% меньше токенов. За полную рабочую сессию это выливается в значительную экономию как по стоимости, так и по использованию контекстного окна.

Ключевые возможности

Три уровня сжатия

Lite — убирает лишнее и хеджирование, предложения остаются полными, стиль профессиональный, но компактный.

Full (режим по умолчанию) — удаляет артикли, допускает фрагменты, использует краткие синонимы.

Ultra — голые фрагменты, аббревиатуры (DB, auth, fn), стрелки для причинно-следственных связей.

Автоматическое переключение в безопасный режим

Автоправило: Caveman автоматически переходит на нормальную прозу для предупреждений безопасности, подтверждений необратимых действий, многошаговых последовательностей и когда пользователь повторяет вопрос.

Поддержка языков

Сохраняется язык пользователя: если пишешь по-португальски — ответ приходит на португальском в стиле пещерного человека. Испанский → испанский Caveman. Сжимается стиль, но не язык.

Caveman-compress — сжатие контекста

Caveman-compress — дополнительный субнавык, который перезаписывает файлы памяти (CLAUDE.md, заметки проекта) так, чтобы каждая новая сессия начиналась с меньшего контекста. Экономия токенов — не разовая, а на каждой сессии.

Расширенная версия добавляет /caveman-compress (перезаписывает CLAUDE.md в caveman-стиле, сокращая 46% входящих токенов на сессию) и /caveman-review (ультрасжатые комментарии к PR: одна строка на проблему — локация + проблема + фикс).

Поддержка 30+ агентов

Автоактивация каждую сессию: Claude Code, Codex, Gemini (встроено). Cursor / Windsurf / Cline / Copilot получают постоянно действующие файлы правил через --with-init. Другие агенты запускают через /caveman за сессию.

Установка

Установка одной командой для macOS / Linux / WSL / Git Bash:

curl -fsSL https://raw.githubusercontent.com/JuliusBrussee/caveman/main/install.sh | bash

Для Windows (PowerShell 5.1+):

irm https://raw.githubusercontent.com/JuliusBrussee/caveman/main/install.ps1 | iex

Занимает ~30 секунд.

Требуется Node ≥ 18.

Активация: наберите /caveman или скажите «talk like caveman». Остановка — «normal mode».

💡 Совет по установке
Если установка сломалась, просто откройте агента и напишите: «Read CLAUDE.md and INSTALL.md, install caveman for me» — агент исправит всё сам.

Схема работы


graph LR
    A[Запрос пользователя] --> B[ИИ-агент обрабатывает]
    B --> C{Caveman активен?}
    C -- Да --> D[Удаление артиклей,\nплизантностей, хеджинга]
    C -- Нет --> E[Стандартный вывод]
    D --> F{Безопасная ситуация?}
    F -- Нет --> G[Авто-переход\nна нормальную прозу]
    F -- Да --> H[Caveman-ответ\n-65..75% токенов]
    E --> I[Полный ответ]

Бенчмарки

Среднее сокращение выходных токенов — 65% по 10 промптам (диапазон 22–87%).

Трёхплечевой тест сравнивал Caveman не с многословным поведением по умолчанию, а с режимом «Answer concisely» — так что дельта честная.

Мартовское исследование 2026 года «Brevity Constraints Reverse Performance Hierarchies in Language Models» обнаружило, что ограничение больших моделей на краткие ответы повышало точность на 26 пунктов на определённых бенчмарках.

Главный выигрыш — читаемость и скорость, экономия затрат — бонус.

Тарифы и цены

Проект распространяется под лицензией MIT. Caveman полностью бесплатен. Экономия происходит за счёт меньшего количества потребляемых токенов Anthropic/OpenAI API, которые сами по себе тарифицируются по стандартным ценам провайдеров.

📝 Реальный пример экономии
Если типичная сессия с Claude Code потребляет 200 000 выходных токенов, Caveman сокращает её до ~70 000–80 000 токенов. При цене Claude Sonnet 4 ($3/MTok) — это экономия порядка $0.36 за одну сессию, а за месяц — десятки долларов.

Плюсы и минусы

КритерийОценка
Плюсы
Бесплатный и открытый (MIT)
Установка за 30 секунд
Поддержка 30+ агентов
65–75% экономии токенов
Сохранение технической точности
Мультиязычность
Автозащита при опасных операциях
Три уровня сжатия (lite/full/ultra)
Минусы
Стиль может раздражать в нетехнических контекстах⚠️
Требует Node ≥ 18⚠️
Не влияет на входящие токены (контекст)⚠️
Нет GUI — только CLI/текстовые команды⚠️

Сравнение с альтернативами

ПараметрCavemanclaude-token-optimizerClaude-Skills rescue-tokens
Что оптимизируетВыходные токены (ответы агента)Входящие токены (CLAUDE.md, контекст)Контекст + ответы
Сокращение65–75% outputДо 9 700 токенов/сессию контекстаДо 90% вербозности
Установка1 команда (curl/irm)curl + cto initnpm install
Агенты30+Claude CodeClaude Code
ЛицензияMITMITMIT
Стиль работыПостоянный режим сессииАудит файлов / CIПо триггеру
СовместимостьmacOS, Linux, WindowsmacOS, LinuxmacOS, Linux

Claude Code hooks запускают shell-скрипты на события — до/после вызовов инструментов, при старте/завершении сессии; claude-token-optimizer можно связать с этими хуками для активного мониторинга токенов. Таким образом, Caveman и claude-token-optimizer решают разные задачи и могут использоваться совместно.

⚠ Важно понимать
Caveman оптимизирует выходные токены (то, что пишет агент), но не влияет на входящие (ваш контекст, CLAUDE.md, история чата). Для комплексной оптимизации используйте Caveman вместе с инструментами управления контекстом.

Вердикт

Caveman подойдёт:

  • Разработчикам, которые ежедневно работают с Claude Code, Cursor, Windsurf
  • Командам с API-подпиской, платящим за каждый токен
  • Тем, кто ценит скорость и лаконичность над многословными объяснениями
  • Пользователям, у которых быстро заполняется контекстное окно

Caveman НЕ подойдёт:

  • Если вы работаете с нетехническим контентом, где важна читаемость и полнота
  • Если стиль «пещерного человека» мешает коммуникации внутри команды
  • Для задач, где подробные пошаговые объяснения критичны (онбординг, обучение)

Рейтинг: 8.5 / 10

КатегорияОценка
Эффективность9/10
Простота установки10/10
Совместимость9/10
Зрелость/надёжность7/10
Документация8/10

Caveman — один из самых элегантных хаков в экосистеме Claude Code: простая идея («говори меньше»), реализованная через SKILL.md-файл, даёт реальную измеримую экономию. Большинство выходных токенов Claude Code — это не код, а нарратив. Caveman убирает всё это, сохраняя каждый технический факт, каждый путь к файлу, каждый блок кода байт-в-байт. Попробовать стоит каждому, кто регулярно работает с AI-агентами.