VulnClaw: AI-агент для пентеста на естественном языке

VulnClaw: когда ИИ сам взламывает — по вашей команде

VulnClaw — самостоятельный AI-агент для пентеста, построенный на базе LLM Agent + MCP-цепочки инструментов + оркестрации навыков проникновения, совместимый с OpenAI, MiniMax, DeepSeek и аналогичными моделями. Достаточно ввести задачу на естественном языке — и агент автоматически пройдёт весь путь от разведки до генерации отчёта. Проект опубликован на GitHub под MIT-лицензией и доступен через PyPI.

Что умеет VulnClaw

Пользователь задаёт цель в произвольной форме — например, «проведи пентест http://target.example.com» — и агент последовательно выполняет: разведку (fingerprinting, сканирование портов, перебор директорий), обнаружение уязвимостей (инъекции, известные CVE, неверные конфигурации), эксплуатацию (верификация PoC, получение доступа) и генерацию структурированного отчёта с Python PoC-скриптом.

ℹ Для кого этот инструмент

VulnClaw предназначен исключительно для авторизованного тестирования безопасности: CTF-соревнований, учебных стендов и официальных red team-операций. Использование против систем без явного письменного разрешения владельца незаконно.

Архитектура: от «фиксированных раундов» к целевому поиску

Ключевое архитектурное решение VulnClaw — переход от старой модели с заранее заданным числом итераций к goal-driven solver (движок, управляемый целью). Старый подход заставлял агент «крутиться на месте» при слабых моделях — раз за разом запрашивая одну и ту же страницу, не совершая реальных атакующих действий.

Новая модель строит пентест как поиск в пространстве состояний:


graph TD
    A["Цель / Origin"] --> B["REASON\n(читает весь граф)"];
    B --> C{Цель достигнута?};
    C -- Нет --> D["EXPLORE\n(берёт один Intent)"];
    D --> E["Выполняет инструмент"];
    E --> F["Записывает Fact\n(подтверждённый вывод)"];
    F --> B;
    C -- Да --> G["Отчёт + PoC"];
    B --> H{"Нет новых направлений\nили бюджет исчерпан"};
    H --> G;

Движок оперирует двумя примитивами: Fact — объективный факт, подтверждённый реальным выводом инструмента, и Intent — заявленное направление исследования, ещё не выполненное. Как только «стартовая страница — форма входа» становится Fact, агент не возвращается к ней повторно, а предлагает следующий шаг — например, тест SQL-инъекции.

Антигаллюцинационный механизм

Одна из главных проблем LLM в задачах безопасности — выдуманные результаты: агент «находит» flag, которого не существует. VulnClaw решает это evidence gate (воротами доказательств): любое утверждение о найденном флаге или уязвимости принимается только если оно дословно присутствует в реальном выводе инструмента. Если нет — вывод помечается как [未验证] (непроверено) и отбрасывается.

⚠ Важно об изоляции

Встроенный инструмент python_execute позволяет конструировать payload’ы и парсить ответы, однако на данный момент это высокорискованная экспериментальная возможность — не следует рассматривать её как полноценную изолированную песочницу.

Ключевые возможности

Функция	Описание
13 LLM-провайдеров	OpenAI, DeepSeek, MiniMax, Zhipu, Moonshot, Qwen, SiliconFlow, Doubao, Baichuan и другие — переключение одной командой
21 навык пентеста	7 базовых + 14 специализированных (CTF Web/Crypto/Misc, OSINT-разведка, база знаний по безопасности)
29 операций кодирования	Base64, Hex, URL, AES, JWT, Morse и другие — LLM вызывает точно, без догадок
MCP-цепочка	4 MCP-сервиса: `fetch`, `memory` (локально), `chrome-devtools`, `burp` (внешние)
Persistent-режим	100 раундов/цикл × 10 циклов = 1000 раундов с автоматической генерацией отчёта
Web UI	Запуск через `vulnclaw web`, доступен по адресу `127.0.0.1:7788`
TUI-рабочее место	Терминальный графический интерфейс с подтверждением области тестирования перед запуском

Быстрый старт

# Установка из PyPI
pip install vulnclaw

# Выбор LLM-провайдера
vulnclaw config provider deepseek

# Установка API-ключа
vulnclaw config set llm.api_key sk-your-key-here

# Запуск полного пентеста
vulnclaw run http://target.example.com

# Или целевой режим с явной целью
vulnclaw solve target.com --goal "получить флаг"

Проект опубликован на PyPI 25 июня 2026 года под MIT-лицензией, требует Python ≥ 3.10 и помечен как Development Status: Alpha.

💡 Проверка окружения

Перед первым запуском выполните vulnclaw doctor — команда проверит наличие Python, Node.js, npx, nmap, корректность LLM-конфигурации и статус MCP-сервисов.

Контекст: AI + MCP = новый стандарт автопентеста

Агентный ИИ трансформирует сферу безопасности, автоматизируя задачи, которые раньше выполнялись вручную — от поиска уязвимостей до реверс-инжиниринга и пентеста. Появление стандарта Model Context Protocol (MCP) отделило агента от инструментов, принеся парадигму RPC (remote procedure call) в агентные приложения и позволив агентам мгновенно подключать новые инструменты.

Исследования показывают: задачи, которые традиционно выполнял человек-пентестер, уже могут быть автоматизированы агентным ИИ с использованием MCP-инструментов — хотя эффективность сильно зависит от используемой модели.

Ключевое отличие VulnClaw от простого сканера — агент не просто перечисляет потенциальные риски, а доводит атаку до доказательного результата, фиксируя каждый шаг в структурированном отчёте с готовым PoC-кодом.

VulnClaw пока находится в стадии Alpha, однако уже сейчас представляет интерес для специалистов по безопасности, преподавателей и участников CTF-соревнований как практический пример того, как LLM-агенты меняют подход к наступательной кибербезопасности.

VulnClaw: когда ИИ сам взламывает — по вашей команде

Что умеет VulnClaw

Архитектура: от «фиксированных раундов» к целевому поиску

Антигаллюцинационный механизм

Ключевые возможности

Быстрый старт

Контекст: AI + MCP = новый стандарт автопентеста

Источники

Похожие статьи

HexStrike AI: ИИ-агенты для пентеста через MCP

AstrBot: AI-агент для мессенджеров — обзор

Goose: открытый AI-агент от Block / AAIF

Career-Ops: AI-агент для поиска работы на базе Claude Code

Vibe-Trading v0.1.9: шесть новых брокеров и архитектура коннекторов