
Caveman: экономия 65% токенов в Claude Code
Обзор Caveman — бесплатного навыка для Claude Code и 30+ агентов, сокращающего вывод на 65–75% без потери точности.
Caveman: экономия 65–75% токенов в Claude Code — обзор инструмента
«Why use many token when few token do trick» — именно этим принципом руководствуется проект Caveman, превращая многословные ответы ИИ-агентов в чёткие, телеграфные команды.
Что такое Caveman и для кого он предназначен
Caveman — это скилл/плагин для Claude Code (а также Codex, Gemini, Cursor, Windsurf, Cline, Copilot и ещё 30+ агентов), который заставляет ИИ-агента отвечать в стиле пещерного человека — и тем самым сокращает ~75% выходных токенов, сохраняя полную техническую точность.
Проект создан Юлиусом Бруссе и быстро набрал популярность: репозиторий занял 1-е место в трендах GitHub почти с 5 000 звёздами и стал темой №1 для обсуждения на Hacker News.
Кому нужен Caveman:
- Разработчикам, активно использующим Claude Code / Cursor / Windsurf
- Командам, которые экономят на API-затратах
- Всем, кто устал от «воды» в ответах ИИ и хочет скорость
Как это работает
Ключевой механизм — удаление всего лингвистического наполнителя, который обычно генерируют языковые модели: артиклей («a», «an», «the»), приветствий вроде «I would be happy to» и хеджирующих фраз типа «it might be worth considering».
Caveman влияет только на выходные токены — токены мышления/рассуждения остаются нетронутыми. Мозг не становится меньше — только рот.
Пример трансформации ответа
До (стандартный режим):
"The reason your React component is re-rendering is likely because
you're creating a new object reference on each render cycle.
When you pass an inline object as a prop, React's shallow comparison
sees it as a different object every time, which triggers a re-render.
I'd recommend using useMemo to memoize the object."
После (Caveman mode):
"New object ref each render.
Inline object prop = new ref = re-render.
Wrap in useMemo."
Та же информация — примерно на 65% меньше токенов. За полную рабочую сессию это выливается в значительную экономию как по стоимости, так и по использованию контекстного окна.
Ключевые возможности
Три уровня сжатия
Lite — убирает лишнее и хеджирование, предложения остаются полными, стиль профессиональный, но компактный.
Full (режим по умолчанию) — удаляет артикли, допускает фрагменты, использует краткие синонимы.
Ultra — голые фрагменты, аббревиатуры (DB, auth, fn), стрелки для причинно-следственных связей.
Автоматическое переключение в безопасный режим
Автоправило: Caveman автоматически переходит на нормальную прозу для предупреждений безопасности, подтверждений необратимых действий, многошаговых последовательностей и когда пользователь повторяет вопрос.
Поддержка языков
Сохраняется язык пользователя: если пишешь по-португальски — ответ приходит на португальском в стиле пещерного человека. Испанский → испанский Caveman. Сжимается стиль, но не язык.
Caveman-compress — сжатие контекста
Caveman-compress — дополнительный субнавык, который перезаписывает файлы памяти (CLAUDE.md, заметки проекта) так, чтобы каждая новая сессия начиналась с меньшего контекста. Экономия токенов — не разовая, а на каждой сессии.
Расширенная версия добавляет /caveman-compress (перезаписывает CLAUDE.md в caveman-стиле, сокращая 46% входящих токенов на сессию) и /caveman-review (ультрасжатые комментарии к PR: одна строка на проблему — локация + проблема + фикс).
Поддержка 30+ агентов
Автоактивация каждую сессию: Claude Code, Codex, Gemini (встроено). Cursor / Windsurf / Cline / Copilot получают постоянно действующие файлы правил через --with-init. Другие агенты запускают через /caveman за сессию.
Установка
Установка одной командой для macOS / Linux / WSL / Git Bash:
curl -fsSL https://raw.githubusercontent.com/JuliusBrussee/caveman/main/install.sh | bash
Для Windows (PowerShell 5.1+):
irm https://raw.githubusercontent.com/JuliusBrussee/caveman/main/install.ps1 | iex
Занимает ~30 секунд.
Требуется Node ≥ 18.
Активация: наберите /caveman или скажите «talk like caveman». Остановка — «normal mode».
Схема работы
graph LR
A[Запрос пользователя] --> B[ИИ-агент обрабатывает]
B --> C{Caveman активен?}
C -- Да --> D[Удаление артиклей,\nплизантностей, хеджинга]
C -- Нет --> E[Стандартный вывод]
D --> F{Безопасная ситуация?}
F -- Нет --> G[Авто-переход\nна нормальную прозу]
F -- Да --> H[Caveman-ответ\n-65..75% токенов]
E --> I[Полный ответ]
Бенчмарки
Среднее сокращение выходных токенов — 65% по 10 промптам (диапазон 22–87%).
Трёхплечевой тест сравнивал Caveman не с многословным поведением по умолчанию, а с режимом «Answer concisely» — так что дельта честная.
Мартовское исследование 2026 года «Brevity Constraints Reverse Performance Hierarchies in Language Models» обнаружило, что ограничение больших моделей на краткие ответы повышало точность на 26 пунктов на определённых бенчмарках.
Главный выигрыш — читаемость и скорость, экономия затрат — бонус.
Тарифы и цены
Проект распространяется под лицензией MIT. Caveman полностью бесплатен. Экономия происходит за счёт меньшего количества потребляемых токенов Anthropic/OpenAI API, которые сами по себе тарифицируются по стандартным ценам провайдеров.
Плюсы и минусы
| Критерий | Оценка |
|---|---|
| Плюсы | |
| Бесплатный и открытый (MIT) | ✅ |
| Установка за 30 секунд | ✅ |
| Поддержка 30+ агентов | ✅ |
| 65–75% экономии токенов | ✅ |
| Сохранение технической точности | ✅ |
| Мультиязычность | ✅ |
| Автозащита при опасных операциях | ✅ |
| Три уровня сжатия (lite/full/ultra) | ✅ |
| Минусы | |
| Стиль может раздражать в нетехнических контекстах | ⚠️ |
| Требует Node ≥ 18 | ⚠️ |
| Не влияет на входящие токены (контекст) | ⚠️ |
| Нет GUI — только CLI/текстовые команды | ⚠️ |
Сравнение с альтернативами
| Параметр | Caveman | claude-token-optimizer | Claude-Skills rescue-tokens |
|---|---|---|---|
| Что оптимизирует | Выходные токены (ответы агента) | Входящие токены (CLAUDE.md, контекст) | Контекст + ответы |
| Сокращение | 65–75% output | До 9 700 токенов/сессию контекста | До 90% вербозности |
| Установка | 1 команда (curl/irm) | curl + cto init | npm install |
| Агенты | 30+ | Claude Code | Claude Code |
| Лицензия | MIT | MIT | MIT |
| Стиль работы | Постоянный режим сессии | Аудит файлов / CI | По триггеру |
| Совместимость | macOS, Linux, Windows | macOS, Linux | macOS, Linux |
Claude Code hooks запускают shell-скрипты на события — до/после вызовов инструментов, при старте/завершении сессии; claude-token-optimizer можно связать с этими хуками для активного мониторинга токенов. Таким образом, Caveman и claude-token-optimizer решают разные задачи и могут использоваться совместно.
Вердикт
Caveman подойдёт:
- Разработчикам, которые ежедневно работают с Claude Code, Cursor, Windsurf
- Командам с API-подпиской, платящим за каждый токен
- Тем, кто ценит скорость и лаконичность над многословными объяснениями
- Пользователям, у которых быстро заполняется контекстное окно
Caveman НЕ подойдёт:
- Если вы работаете с нетехническим контентом, где важна читаемость и полнота
- Если стиль «пещерного человека» мешает коммуникации внутри команды
- Для задач, где подробные пошаговые объяснения критичны (онбординг, обучение)
Рейтинг: 8.5 / 10
| Категория | Оценка |
|---|---|
| Эффективность | 9/10 |
| Простота установки | 10/10 |
| Совместимость | 9/10 |
| Зрелость/надёжность | 7/10 |
| Документация | 8/10 |
Caveman — один из самых элегантных хаков в экосистеме Claude Code: простая идея («говори меньше»), реализованная через SKILL.md-файл, даёт реальную измеримую экономию. Большинство выходных токенов Claude Code — это не код, а нарратив. Caveman убирает всё это, сохраняя каждый технический факт, каждый путь к файлу, каждый блок кода байт-в-байт. Попробовать стоит каждому, кто регулярно работает с AI-агентами.