Browserbase Skills: веб-браузер для Claude-агентов

Дай своему AI-агенту браузер — и он перестанет быть слепым.

Что это такое и для кого

Browserbase Skills — это набор модульных «навыков» (Agent Skills), которые расширяют AI-агентов, таких как Claude Code, экспертизой в конкретной предметной области. Навыки упаковывают инструкции, рабочие процессы и лучшие практики, которые агент использует автоматически при обращении к соответствующим задачам.

Проще говоря: вы устанавливаете пакет один раз, и Claude «понимает», как управлять браузером, скачивать страницы, обходить капчи и деплоить автоматизацию в облако — без написания кастомного клея.

Browserbase Skills обучают AI-агентов использовать Browserbase в четырёх режимах: интерактивная браузерная автоматизация через browse CLI, лёгкая загрузка страниц через Fetch API, деплой функций и работа с CLI bb.

Целевая аудитория:

  • Разработчики, QA-команды, дата-инженеры и стартапы, работающие с веб-автоматизацией.
  • Те, кто хочет делегировать рутинный браузинг AI-агенту в Claude Code, Cursor или Codex.
  • Команды, которым нужны надёжные облачные сессии с anti-bot защитой.
ℹ Суть проекта
browserbase/skills — это open-source репозиторий на GitHub, который работает поверх платформы Browserbase (Browser-as-a-Service). Сам SDK навыков бесплатен; платите только за часы браузерных сессий в облаке.

Архитектура: как это работает


graph LR
    A[Вы → Claude Code] -->|естественный язык| B[Browserbase Skill]
    B -->|browse CLI| C{Где запустить?}
    C -->|локально| D[Chrome / Chromium]
    C -->|удалённо| E[Browserbase Cloud]
    E --> F[Anti-bot stealth]
    E --> G[CAPTCHA-solving]
    E --> H[Residential proxies]
    B -->|Fetch API| I[Статические страницы]
    B -->|bb CLI| J[Functions / Sessions]
    D --> K[Результат → агенту]
    F --> K
    G --> K
    H --> K
    I --> K
    J --> K

Browserbase CLI — единая точка входа для агентов: загрузить страницу, поискать в интернете, просматривать как реальный пользователь, управлять сессиями, деплоить функции и многое другое.


Ключевые возможности

1. Браузерная автоматизация (browser skill)

Автоматизирует взаимодействие с браузером с помощью естественного языка через CLI-команды. Используется, когда нужно просматривать сайты, навигировать по страницам, извлекать данные, делать скриншоты, заполнять формы, кликать кнопки или работать с веб-приложениями.

Поддерживаются удалённые сессии Browserbase с автоматическим решением CAPTCHA, anti-bot stealth-режимом и residential-прокси — идеально для скрейпинга защищённых сайтов и работы с JavaScript-heavy страницами.

# Установка CLI
npm install -g @browserbasehq/browse-cli

# Базовый сценарий
browse open https://news.ycombinator.com
browse snapshot          # получить дерево элементов с refs
browse click @0-5        # кликнуть элемент по ref
browse screenshot        # сделать скриншот
browse stop

2. Fetch API (fetch skill)

Загружает HTML или JSON со статических страниц без создания полноценной браузерной сессии — позволяет инспектировать статус-коды, заголовки, следовать редиректам.

from browserbase import Browserbase
import os

bb = Browserbase(api_key=os.environ["BROWSERBASE_API_KEY"])
response = bb.fetch_api.create(
    url="https://example.com",
    allow_redirects=True,
)
print(response.status_code)  # 200
print(response.content)      # HTML страницы

3. Трассировка браузера (browser-trace skill)

Используется, когда нужно отладить упавший запуск, проаудировать активность сети/консоли/DOM, прикрепить трейс к текущей сессии или передать структурированные постраничные сводки обратно в цикл агента.

Трейс записывает полный DevTools firehose в NDJSON, параллельно опрашивает скриншоты и DOM-дампы, нарезая всё в дерево директорий, по которому могут искать bash-инструменты.

4. Синхронизация cookies и аутентификация

Используйте browse env local --auto-connect, чтобы агент переиспользовал вашу существующую Chrome-сессию, cookies или состояние логина.

Browserbase-контексты сохраняют cookies, storage и состояние браузера между сессиями, так что агент остаётся залогиненным и возобновляет работу без повторного прохождения авторизации.

5. AI-тестирование интерфейсов

Поддерживается AI-управляемое adversarial UI-тестирование — анализирует git diff для тестирования изменений или исследует всё приложение целиком для поиска багов.

📝 Пример: заказать пиццу через Claude
Установив skill, просто скажите Claude «check Hacker News top comments» или «order me a pizza» — он автоматически откроет браузер и выполнит задачу. Никаких ручных операций — как персональный ассистент 24/7.

Установка

Vercel Skills CLI предоставляет простой способ установить навыки в несколько AI-агентов, включая Claude Code, Cursor и другие:

# Через Vercel Skills CLI
npx skills add browserbase/skills --skill browser
npx skills add browserbase/skills --skill fetch
npx skills add browserbase/skills --skill functions
npx skills add browserbase/skills --skill browserbase-cli
# Через Claude Code plugin marketplace
claude plugin install browse@browserbase --scope local
claude plugin install fetch@browserbase --scope local

Требуется Node 18+, browse CLI (npm install -g @browserbasehq/browse-cli@alpha) и опционально jq для ad-hoc запросов к JSONL-файлам.


Тарифы и цены

Browserbase предлагает гибкие планы, масштабирующиеся от соло-разработчиков до enterprise-команд. Сам репозиторий browserbase/skillsполностью бесплатный open-source. Платите вы только за использование облачной инфраструктуры Browserbase.

ТарифЦена/месЧасы браузераКонкурентностьCaptchaПрокси
Free$01 час1
Developer$20200 часов~3–52 ГБ
Startup$99500 часовдо 505 ГБ
ScaleCustomГибко250+Custom

Сессии тарифицируются поминутно, причём первая минута округляется вверх. Если вы превысили включённое использование на тарифах Developer или Startup, сервис не отключится — просто начнут начисляться overage-расходы по тарифной ставке сверх лимита.

💡 Совет по экономии
Если ваши сессии короткоживущие — используйте функцию keep-alive для переподключения и повторного использования той же браузерной сессии вместо создания новой. Это существенно снижает расходы.

Плюсы и минусы

✅ Плюсы❌ Минусы
Open-source, бесплатный SDKОблачные сессии — платные
Работает с Claude Code, Cursor, Codex, Gemini CLIЗависимость от стороннего сервиса Browserbase
Естественный язык вместо кода для управления браузеромAlpha-статус у ряда фич (browse cdp)
Anti-bot stealth + CAPTCHA-solving в облакеТребует Node 18+ и Chrome для локальной работы
Поддержка persistent-контекстов (cookies, логины)Free-план очень ограничен (1 час/мес)
Встроенная трассировка и дебаггинг через DevToolsСложная настройка для корпоративных сетей
Поддерживает Python, JS, curl (Fetch API)Нет нативной поддержки Firefox в Skills-режиме

Сравнение с альтернативами

Browserbase предоставляет hosted headless browsers как сервис, функционируя по сути как AWS Lambda для автоматизации Chrome и Firefox.

Параметрbrowserbase/skillsPlaywright (self-hosted)ScrapeGraphAI
ТипSkills SDK + BaaSБиблиотека автоматизацииAI-first скрейпинг
Интеграция с Claude✅ Нативная⚠️ Через MCP/скрипты❌ Отдельный инструмент
Управление инфраструктурой✅ Облако Browserbase❌ Самостоятельно✅ Облако
Anti-bot / CAPTCHA✅ Встроено❌ Нужен доп. сервис✅ Частично
СтоимостьОт $0 (SDK) + от $20/месСерверные расходы ~$20/месОт $0 (OSS)
Сложность старта🟢 Низкая🔴 Высокая🟡 Средняя
Подходит для агентов✅ Отлично⚠️ Требует кастомизации⚠️ Ограничено

Browserbase предоставляет управляемые headless-инстансы Chromium, облачную инфраструктуру (без управления серверами), рендеринг JavaScript и обработку сложных сайтов, session persistence и инструменты дебаггинга, интеграцию с Playwright и Puppeteer.

⚠ Учтите перед выбором
Если вам нужна только простая статическая загрузка страниц — Fetch API внутри Skills справится и без облачной подписки. Browserbase-сессии оправданы при работе с защищёнными сайтами, SPA или масштабном параллельном скрейпинге.

Практические примеры

Сценарий 1: QA-тестирование с git diff

# Агент анализирует изменения и тестирует UI
git diff HEAD~1 > changes.diff
# Скажите Claude: "Проверь эти изменения интерфейса"
# browse-skill автоматически откроет браузер и пройдётся по изменённым компонентам

Сценарий 2: Конкурентный мониторинг

browse open https://competitor.com/pricing
browse snapshot
browse get text @pricing-table
browse screenshot pricing-$(date +%Y%m%d).png

Сценарий 3: Автоматизация с авторизацией

# Синхронизировать cookies из локального Chrome в облако
browse env local --auto-connect  # подключиться к вашему Chrome
# Claude: "Войди в панель и скачай отчёт за апрель"

Вердикт

browserbase/skills — один из наиболее продуманных способов дать Claude-агенту «глаза и руки» в вебе. Модульный подход (отдельные skill-пакеты для браузера, fetch, трассировки, CLI) позволяет подключать только нужное. Тесная интеграция с Claude Code, нативный anti-bot и CAPTCHA-solving в облаке делают его выбором №1 для команд, строящих AI-агентов с браузерными возможностями.

Основное ограничение — зависимость от платформы Browserbase: бесплатный тариф слишком мал для production, а серьёзная нагрузка требует подписки. Для одноразовых задач или разработки — вполне доступно.

Рейтинг: 8/10

КритерийОценка
Простота интеграции⭐⭐⭐⭐⭐
Функциональность⭐⭐⭐⭐⭐
Документация⭐⭐⭐⭐
Цена/качество⭐⭐⭐⭐
Надёжность (alpha-фичи)⭐⭐⭐

Кому подойдёт:

  • 🟢 Разработчикам, строящим AI-агентов с браузерными задачами
  • 🟢 QA-инженерам, автоматизирующим регрессионное тестирование
  • 🟢 Дата-инженерам, скрейпящим защищённые сайты
  • 🔴 Тем, кто ищет полностью бесплатное и self-hosted решение без зависимостей