Игра за минуту — и неудобная правда о себе

На сайте llmgame.scalex.dev появилась короткая браузерная игра о permission fatigue (усталости от запросов разрешений): Claude Code просит одобрить команду — но насколько внимательно вы её читаете? Как human-in-the-loop (человек в контуре принятия решений) вы — последняя линия обороны, и игра проверяет, способны ли вы отличить опасные команды от безвредных в условиях давления времени.

Проект появился на Hacker News в разделе «Show HN» и быстро набрал обсуждения — тема задела разработчиков за живое.


Что такое permission fatigue

Permission fatigue — это когнитивное истощение от бесконечного потока запросов на подтверждение действий. Вы одобряете так много легитимных действий, что одно опасное выглядит точно так же. После двадцатого подтверждения подряд это уже мышечная память.

«Сотое “разрешить” выглядит в точности как первое — мозг просто перестаёт это обрабатывать.»

По данным телеметрии Anthropic, пользователи одобряют около 93% запросов на разрешения. Чем больше запросов видит пользователь, тем меньше внимания уделяет каждому — со временем надзор становится всё менее тщательным.

⚠ Реальный риск
Вы не просто «устаёте кликать». Одно пропущенное опасное действие может стоить потери всех данных или утечки ваших облачных ключей.

Как работает игра

Coding agents (агенты для написания кода) действуют на основе естественного языка, чтобы определить свои следующие шаги и выполнять команды — но их «неосторожные руки» могут переслать ваши учётные данные или удалить все резервные копии продакшена.

В игре за ~30–60 секунд нужно успеть проверить поток команд: разрешить безопасные и заблокировать опасные. Среди реальных угроз, которые встречаются в терминале:

КомандаУгрозаТип атаки
rm -rf ~/Удаление домашнего каталогаMalformed command
cat ~/.aws/credentialsКража облачных ключейCredential exfiltration
Чтение ~/DocumentsВыход за пределы проектаScope violation
Скрытые инструкции из буфера обменаПодмена командыPrompt injection

Credential exfiltration — тихий сбор ключей облачного провайдера или SSH. Внутренняя фишинговая кампания в Anthropic показала, что учётные данные успешно похищались в 24 из 25 попыток.

ℹ Механика игры
В конце вы получаете «звание»: от «security-conscious engineer» (если отклоняете всё подряд) до значка за халатность. Цель — найти баланс между скоростью и внимательностью.

graph TD
    A[AI-агент хочет выполнить команду] --> B{Человек читает запрос?}
    B -->|Да, внимательно| C[Правильное решение]
    B -->|Нет, на автопилоте| D[Permission fatigue]
    D --> E[Опасная команда одобрена]
    E --> F[Утечка / потеря данных]
    C --> G[Безопасная работа]


Почему это важно для индустрии

По прогнозу Gartner, к концу 2026 года 40% корпоративных приложений будут включать интегрированных AI-агентов для выполнения задач. Вместе с этим растёт и риск.

По данным отчёта Identity Threat Landscape 2025, в корпоративных средах нечеловеческие идентификаторы уже превышают человеческие в соотношении более 80 к 1.

По мере того как AI-агенты переходят из разряда модных слов в операционную реальность, в командах по кибербезопасности возникает новый вид когнитивного напряжения — agent fatigue.

💡 Как снизить риск

Авторы игры рекомендуют:

  • Использовать devcontainers (изолированные контейнеры для разработки) — локально или в облаке
  • Включить sandbox и hooks в инструментах агентов
  • Ограничить доступные учётные данные: агент не должен иметь доступ к продакшн-базам
  • Не запускать агентов с флагом --dangerously-skip-permissions без дополнительных защитных мер

Антропик попытался решить проблему через Auto mode — автоматический режим, который использует локальные фильтры и серверное сканирование, чтобы оценить команду до её выполнения. Но Auto mode имеет свою цену: иногда он ошибочно связывает опасные команды с предыдущими сигналами согласия, а частота ложноотрицательных срабатываний составляет 17%.

📝 Попробуйте сами
Игра доступна по адресу llmgame.scalex.dev — займёт не больше минуты, но заставит задуматься.

Итог

Premission fatigue — не абстрактная угроза. Это механизм, при котором сам процесс безопасности становится своей слабостью. После двадцатого подтверждения подряд это уже мышечная память. Вы больше не проверяете. Вы сами стали ботом. Маленькая игра от Scale X — это не развлечение, а зеркало, в котором индустрия видит себя очень чётко.