Каждый четвёртый навык ИИ-агента небезопасен

Исследования показывают: 26,1% навыков (skills) для ИИ-агентов содержат уязвимости, а 5,2% демонстрируют признаки явно вредоносного умысла. На фоне этой статистики NVIDIA выпустила в открытый доступ SkillSpector — специализированный сканер безопасности, который проверяет навыки ИИ-агентов ещё до их установки. SkillSpector — это не универсальный сканер кода, а инструмент, созданный специально для навыков агентов.

⚠ Масштаб угрозы
В январе-феврале 2026 года атакующие опубликовали более 1 200 вредоносных навыков в маркетплейсе OpenClaw, распространяя кражу учётных данных через AMOS credential stealer. Традиционные антивирусы не справляются с такими угрозами.

Что такое навыки агентов и зачем их проверять

ИИ-агенты всё активнее используют модульные расширения — так называемые agent skills (навыки агентов). Навык представляет собой пакет с файлом SKILL.md, содержащим метаданные и инструкции, а также скриптами и вспомогательными ресурсами.

Навыки используются в Claude Code, Codex CLI, Gemini CLI и других инструментах — и выполняются с неявным доверием при минимальной проверке.

Навыки агентов — это не npm-пакеты. По своей природе они ближе к shell-скриптам с повышенными привилегиями. Когда вредоносный навык загружается в Claude Code, Cursor или Codex, он выполняется с полными правами агента: читает кодовую базу, получает доступ к переменным окружения, совершает API-вызовы.

ℹ Контекст угроз
VirusTotal — де-факто стандарт обнаружения вредоносных программ — не способен выявить большинство вредоносного ПО, нацеленного на агентов, что наглядно демонстрирует недостаточность сигнатурного подхода для этой области.

Как работает SkillSpector

SkillSpector поддерживает множество форматов входных данных: Git-репозитории, URL, ZIP-архивы, директории или отдельные файлы. Инструмент обнаруживает 64 паттерна уязвимостей в 16 категориях и использует двухэтапный анализ: быстрый статический разбор с опциональной семантической оценкой через LLM.

SkillSpector сочетает статические проверки с AI-семантическим анализом, выявляя риски, которые пропускают традиционные сканеры: скрытые инструкции, опасные пути в коде, избыточные полномочия, проблемы зависимостей и несоответствия между заявленным назначением навыка и его реальным поведением.


graph TD
    A[Навык для проверки\nGit / ZIP / URL / Dir] --> B[Статический анализ\n64 паттерна, 16 категорий]
    B --> C{Опциональный\nLLM-анализ}
    C -->|Включён| D[Семантическая оценка\nIntent vs. поведение]
    C -->|Отключён --no-llm| E[Только статика]
    D --> F[Risk Score 0–100\nSeverity + Рекомендации]
    E --> F
    F --> G[Отчёт: Terminal / JSON\nMarkdown / SARIF]

16 категорий уязвимостей

КатегорияПримеры паттерновМакс. severity
Prompt InjectionСкрытые инструкции, манипуляция поведениемCRITICAL
Data ExfiltrationСбор API-ключей, утечка контекстаHIGH
Privilege EscalationЗапуск sudo/root, чтение SSH-ключейHIGH
Supply ChainUnpinned deps, curl | bash, тайпосквоттингHIGH
Excessive AgencyАвтономные решения без human-in-the-loopHIGH
Rogue AgentСамомодификация кода, скрытое закреплениеCRITICAL
MCP Tool PoisoningАтаки на Model Context ProtocolHIGH
Behavioral ASTexec(), eval(), динамические импортыCRITICAL

Поддерживаемые LLM-провайдеры

Для семантического анализа можно настроить любой OpenAI-совместимый эндпоинт. Провайдер задаётся через SKILLSPECTOR_PROVIDER. SkillSpector также работает с локальными серверами Ollama, vLLM, llama.cpp и управляемыми inference-шлюзами.

# Быстрый старт
git clone https://github.com/NVIDIA/skillspector.git && cd skillspector
uv venv .venv && source .venv/bin/activate
make install

# Сканирование директории
skillspector scan ./my-skill/

# С LLM-анализом через OpenAI
export SKILLSPECTOR_PROVIDER=openai
export OPENAI_API_KEY=sk-...
skillspector scan ./my-skill/

# SARIF-отчёт для CI/CD
skillspector scan ./my-skill/ --format sarif --output report.sarif

# Только статический анализ (быстро)
skillspector scan ./my-skill/ --no-llm
💡 Интеграция в CI/CD
Используйте SARIF-вывод для интеграции в CI-пайплайн, чтобы каждый новый навык автоматически проходил проверку перед установкой. Формат SARIF поддерживается большинством IDE и систем статического анализа.

Часть более широкой экосистемы безопасности

Верифицированные навыки NVIDIA проходят полный цикл публикации: ежедневные обновления каталога, автоматическая и ручная проверка, сканирование через SkillSpector, криптографическая подпись и документирование через machine-readable skill cards.

Охват сканирования SkillSpector основан на признанных стандартах AI-безопасности, включая OWASP-рекомендации для LLM, риски агентного ИИ и MITRE ATLAS.

NVIDIA публично экспериментирует с криптографической подписью навыков агентов как частью более широкой дорожной карты верификации для корпоративного развёртывания.

Навык может выглядеть абсолютно безвредным при пофайловом анализе и при этом направлять агента к небезопасному поведению — запрашивать более широкий доступ, чем требует его задача, или описывать одно, тогда как вложенные артефакты реализуют совсем другое.

SkillSpector полностью открыт и доступен на GitHub. Его можно применять к любым навыкам — как созданным внутри компании, так и полученным от сторонних поставщиков. Проект распространяется под лицензией Apache 2.0.

📝 Пример отчёта
SkillSpector выставляет оценку риска от 0 до 100. Навык с оценкой 78/100 и статусом HIGH сопровождается конкретными находками: например, сбор переменных окружения с API-ключами (confidence 94%) и их отправка на внешний сервер (confidence 89%) — обе находки указывают на кражу учётных данных.

Почему это важно прямо сейчас

Только 11% предприятий располагают инструментами, специально созданными для защиты AI-систем, тогда как агентный ИИ стремительно уходит в продакшн. SkillSpector — первый специализированный открытый инструмент, закрывающий этот пробел именно на уровне навыков агентов.

Проблема масштабирования ИИ-агентов нередко упирается в доверие: организации быстро запускают пилоты, но промышленное развёртывание тормозит, потому что команды безопасности не могут принять профиль рисков. Verified Agent Skills предлагает структурированный ответ на эти опасения.