VulnClaw: AI-агент для пентеста на естественном языке
VulnClaw — open-source CLI-инструмент на базе LLM Agent + MCP, автоматизирующий полный цикл пентеста: от разведки до генерации отчёта с PoC.
VulnClaw: когда ИИ сам взламывает — по вашей команде
VulnClaw — самостоятельный AI-агент для пентеста, построенный на базе LLM Agent + MCP-цепочки инструментов + оркестрации навыков проникновения, совместимый с OpenAI, MiniMax, DeepSeek и аналогичными моделями. Достаточно ввести задачу на естественном языке — и агент автоматически пройдёт весь путь от разведки до генерации отчёта. Проект опубликован на GitHub под MIT-лицензией и доступен через PyPI.
Что умеет VulnClaw
Пользователь задаёт цель в произвольной форме — например, «проведи пентест http://target.example.com» — и агент последовательно выполняет: разведку (fingerprinting, сканирование портов, перебор директорий), обнаружение уязвимостей (инъекции, известные CVE, неверные конфигурации), эксплуатацию (верификация PoC, получение доступа) и генерацию структурированного отчёта с Python PoC-скриптом.
Архитектура: от «фиксированных раундов» к целевому поиску
Ключевое архитектурное решение VulnClaw — переход от старой модели с заранее заданным числом итераций к goal-driven solver (движок, управляемый целью). Старый подход заставлял агент «крутиться на месте» при слабых моделях — раз за разом запрашивая одну и ту же страницу, не совершая реальных атакующих действий.
Новая модель строит пентест как поиск в пространстве состояний:
graph TD
A["Цель / Origin"] --> B["REASON\n(читает весь граф)"];
B --> C{Цель достигнута?};
C -- Нет --> D["EXPLORE\n(берёт один Intent)"];
D --> E["Выполняет инструмент"];
E --> F["Записывает Fact\n(подтверждённый вывод)"];
F --> B;
C -- Да --> G["Отчёт + PoC"];
B --> H{"Нет новых направлений\nили бюджет исчерпан"};
H --> G;
Движок оперирует двумя примитивами: Fact — объективный факт, подтверждённый реальным выводом инструмента, и Intent — заявленное направление исследования, ещё не выполненное. Как только «стартовая страница — форма входа» становится Fact, агент не возвращается к ней повторно, а предлагает следующий шаг — например, тест SQL-инъекции.
Антигаллюцинационный механизм
Одна из главных проблем LLM в задачах безопасности — выдуманные результаты: агент «находит» flag, которого не существует. VulnClaw решает это evidence gate (воротами доказательств): любое утверждение о найденном флаге или уязвимости принимается только если оно дословно присутствует в реальном выводе инструмента. Если нет — вывод помечается как [未验证] (непроверено) и отбрасывается.
python_execute позволяет конструировать payload’ы и парсить ответы, однако на данный момент это высокорискованная экспериментальная возможность — не следует рассматривать её как полноценную изолированную песочницу.Ключевые возможности
| Функция | Описание |
|---|---|
| 13 LLM-провайдеров | OpenAI, DeepSeek, MiniMax, Zhipu, Moonshot, Qwen, SiliconFlow, Doubao, Baichuan и другие — переключение одной командой |
| 21 навык пентеста | 7 базовых + 14 специализированных (CTF Web/Crypto/Misc, OSINT-разведка, база знаний по безопасности) |
| 29 операций кодирования | Base64, Hex, URL, AES, JWT, Morse и другие — LLM вызывает точно, без догадок |
| MCP-цепочка | 4 MCP-сервиса: fetch, memory (локально), chrome-devtools, burp (внешние) |
| Persistent-режим | 100 раундов/цикл × 10 циклов = 1000 раундов с автоматической генерацией отчёта |
| Web UI | Запуск через vulnclaw web, доступен по адресу 127.0.0.1:7788 |
| TUI-рабочее место | Терминальный графический интерфейс с подтверждением области тестирования перед запуском |
Быстрый старт
# Установка из PyPI
pip install vulnclaw
# Выбор LLM-провайдера
vulnclaw config provider deepseek
# Установка API-ключа
vulnclaw config set llm.api_key sk-your-key-here
# Запуск полного пентеста
vulnclaw run http://target.example.com
# Или целевой режим с явной целью
vulnclaw solve target.com --goal "получить флаг"
Проект опубликован на PyPI 25 июня 2026 года под MIT-лицензией, требует Python ≥ 3.10 и помечен как Development Status: Alpha.
vulnclaw doctor — команда проверит наличие Python, Node.js, npx, nmap, корректность LLM-конфигурации и статус MCP-сервисов.Контекст: AI + MCP = новый стандарт автопентеста
Агентный ИИ трансформирует сферу безопасности, автоматизируя задачи, которые раньше выполнялись вручную — от поиска уязвимостей до реверс-инжиниринга и пентеста. Появление стандарта Model Context Protocol (MCP) отделило агента от инструментов, принеся парадигму RPC (remote procedure call) в агентные приложения и позволив агентам мгновенно подключать новые инструменты.
Исследования показывают: задачи, которые традиционно выполнял человек-пентестер, уже могут быть автоматизированы агентным ИИ с использованием MCP-инструментов — хотя эффективность сильно зависит от используемой модели.
Ключевое отличие VulnClaw от простого сканера — агент не просто перечисляет потенциальные риски, а доводит атаку до доказательного результата, фиксируя каждый шаг в структурированном отчёте с готовым PoC-кодом.
VulnClaw пока находится в стадии Alpha, однако уже сейчас представляет интерес для специалистов по безопасности, преподавателей и участников CTF-соревнований как практический пример того, как LLM-агенты меняют подход к наступательной кибербезопасности.