
Browserbase Skills: веб-браузер для Claude-агентов
Обзор browserbase/skills — SDK навыков для Claude с браузерной автоматизацией, fetch-API и cloud-сессиями. Для кого, как работает, тарифы и альтернативы.
Browserbase Skills: веб-браузер для Claude-агентов
Дай своему AI-агенту браузер — и он перестанет быть слепым.
Что это такое и для кого
Browserbase Skills — это набор модульных «навыков» (Agent Skills), которые расширяют AI-агентов, таких как Claude Code, экспертизой в конкретной предметной области. Навыки упаковывают инструкции, рабочие процессы и лучшие практики, которые агент использует автоматически при обращении к соответствующим задачам.
Проще говоря: вы устанавливаете пакет один раз, и Claude «понимает», как управлять браузером, скачивать страницы, обходить капчи и деплоить автоматизацию в облако — без написания кастомного клея.
Browserbase Skills обучают AI-агентов использовать Browserbase в четырёх режимах: интерактивная браузерная автоматизация через browse CLI, лёгкая загрузка страниц через Fetch API, деплой функций и работа с CLI bb.
Целевая аудитория:
- Разработчики, QA-команды, дата-инженеры и стартапы, работающие с веб-автоматизацией.
- Те, кто хочет делегировать рутинный браузинг AI-агенту в Claude Code, Cursor или Codex.
- Команды, которым нужны надёжные облачные сессии с anti-bot защитой.
Архитектура: как это работает
graph LR
A[Вы → Claude Code] -->|естественный язык| B[Browserbase Skill]
B -->|browse CLI| C{Где запустить?}
C -->|локально| D[Chrome / Chromium]
C -->|удалённо| E[Browserbase Cloud]
E --> F[Anti-bot stealth]
E --> G[CAPTCHA-solving]
E --> H[Residential proxies]
B -->|Fetch API| I[Статические страницы]
B -->|bb CLI| J[Functions / Sessions]
D --> K[Результат → агенту]
F --> K
G --> K
H --> K
I --> K
J --> K
Browserbase CLI — единая точка входа для агентов: загрузить страницу, поискать в интернете, просматривать как реальный пользователь, управлять сессиями, деплоить функции и многое другое.
Ключевые возможности
1. Браузерная автоматизация (browser skill)
Автоматизирует взаимодействие с браузером с помощью естественного языка через CLI-команды. Используется, когда нужно просматривать сайты, навигировать по страницам, извлекать данные, делать скриншоты, заполнять формы, кликать кнопки или работать с веб-приложениями.
Поддерживаются удалённые сессии Browserbase с автоматическим решением CAPTCHA, anti-bot stealth-режимом и residential-прокси — идеально для скрейпинга защищённых сайтов и работы с JavaScript-heavy страницами.
# Установка CLI
npm install -g @browserbasehq/browse-cli
# Базовый сценарий
browse open https://news.ycombinator.com
browse snapshot # получить дерево элементов с refs
browse click @0-5 # кликнуть элемент по ref
browse screenshot # сделать скриншот
browse stop
2. Fetch API (fetch skill)
Загружает HTML или JSON со статических страниц без создания полноценной браузерной сессии — позволяет инспектировать статус-коды, заголовки, следовать редиректам.
from browserbase import Browserbase
import os
bb = Browserbase(api_key=os.environ["BROWSERBASE_API_KEY"])
response = bb.fetch_api.create(
url="https://example.com",
allow_redirects=True,
)
print(response.status_code) # 200
print(response.content) # HTML страницы
3. Трассировка браузера (browser-trace skill)
Используется, когда нужно отладить упавший запуск, проаудировать активность сети/консоли/DOM, прикрепить трейс к текущей сессии или передать структурированные постраничные сводки обратно в цикл агента.
Трейс записывает полный DevTools firehose в NDJSON, параллельно опрашивает скриншоты и DOM-дампы, нарезая всё в дерево директорий, по которому могут искать bash-инструменты.
4. Синхронизация cookies и аутентификация
Используйте browse env local --auto-connect, чтобы агент переиспользовал вашу существующую Chrome-сессию, cookies или состояние логина.
Browserbase-контексты сохраняют cookies, storage и состояние браузера между сессиями, так что агент остаётся залогиненным и возобновляет работу без повторного прохождения авторизации.
5. AI-тестирование интерфейсов
Поддерживается AI-управляемое adversarial UI-тестирование — анализирует git diff для тестирования изменений или исследует всё приложение целиком для поиска багов.
Установка
Vercel Skills CLI предоставляет простой способ установить навыки в несколько AI-агентов, включая Claude Code, Cursor и другие:
# Через Vercel Skills CLI
npx skills add browserbase/skills --skill browser
npx skills add browserbase/skills --skill fetch
npx skills add browserbase/skills --skill functions
npx skills add browserbase/skills --skill browserbase-cli
# Через Claude Code plugin marketplace
claude plugin install browse@browserbase --scope local
claude plugin install fetch@browserbase --scope local
Требуется Node 18+, browse CLI (npm install -g @browserbasehq/browse-cli@alpha) и опционально jq для ad-hoc запросов к JSONL-файлам.
Тарифы и цены
Browserbase предлагает гибкие планы, масштабирующиеся от соло-разработчиков до enterprise-команд. Сам репозиторий browserbase/skills — полностью бесплатный open-source. Платите вы только за использование облачной инфраструктуры Browserbase.
| Тариф | Цена/мес | Часы браузера | Конкурентность | Captcha | Прокси |
|---|---|---|---|---|---|
| Free | $0 | 1 час | 1 | ❌ | ❌ |
| Developer | $20 | 200 часов | ~3–5 | ✅ | 2 ГБ |
| Startup | $99 | 500 часов | до 50 | ✅ | 5 ГБ |
| Scale | Custom | Гибко | 250+ | ✅ | Custom |
Сессии тарифицируются поминутно, причём первая минута округляется вверх. Если вы превысили включённое использование на тарифах Developer или Startup, сервис не отключится — просто начнут начисляться overage-расходы по тарифной ставке сверх лимита.
Плюсы и минусы
| ✅ Плюсы | ❌ Минусы |
|---|---|
| Open-source, бесплатный SDK | Облачные сессии — платные |
| Работает с Claude Code, Cursor, Codex, Gemini CLI | Зависимость от стороннего сервиса Browserbase |
| Естественный язык вместо кода для управления браузером | Alpha-статус у ряда фич (browse cdp) |
| Anti-bot stealth + CAPTCHA-solving в облаке | Требует Node 18+ и Chrome для локальной работы |
| Поддержка persistent-контекстов (cookies, логины) | Free-план очень ограничен (1 час/мес) |
| Встроенная трассировка и дебаггинг через DevTools | Сложная настройка для корпоративных сетей |
| Поддерживает Python, JS, curl (Fetch API) | Нет нативной поддержки Firefox в Skills-режиме |
Сравнение с альтернативами
Browserbase предоставляет hosted headless browsers как сервис, функционируя по сути как AWS Lambda для автоматизации Chrome и Firefox.
| Параметр | browserbase/skills | Playwright (self-hosted) | ScrapeGraphAI |
|---|---|---|---|
| Тип | Skills SDK + BaaS | Библиотека автоматизации | AI-first скрейпинг |
| Интеграция с Claude | ✅ Нативная | ⚠️ Через MCP/скрипты | ❌ Отдельный инструмент |
| Управление инфраструктурой | ✅ Облако Browserbase | ❌ Самостоятельно | ✅ Облако |
| Anti-bot / CAPTCHA | ✅ Встроено | ❌ Нужен доп. сервис | ✅ Частично |
| Стоимость | От $0 (SDK) + от $20/мес | Серверные расходы ~$20/мес | От $0 (OSS) |
| Сложность старта | 🟢 Низкая | 🔴 Высокая | 🟡 Средняя |
| Подходит для агентов | ✅ Отлично | ⚠️ Требует кастомизации | ⚠️ Ограничено |
Browserbase предоставляет управляемые headless-инстансы Chromium, облачную инфраструктуру (без управления серверами), рендеринг JavaScript и обработку сложных сайтов, session persistence и инструменты дебаггинга, интеграцию с Playwright и Puppeteer.
Практические примеры
Сценарий 1: QA-тестирование с git diff
# Агент анализирует изменения и тестирует UI
git diff HEAD~1 > changes.diff
# Скажите Claude: "Проверь эти изменения интерфейса"
# browse-skill автоматически откроет браузер и пройдётся по изменённым компонентам
Сценарий 2: Конкурентный мониторинг
browse open https://competitor.com/pricing
browse snapshot
browse get text @pricing-table
browse screenshot pricing-$(date +%Y%m%d).png
Сценарий 3: Автоматизация с авторизацией
# Синхронизировать cookies из локального Chrome в облако
browse env local --auto-connect # подключиться к вашему Chrome
# Claude: "Войди в панель и скачай отчёт за апрель"
Вердикт
browserbase/skills — один из наиболее продуманных способов дать Claude-агенту «глаза и руки» в вебе. Модульный подход (отдельные skill-пакеты для браузера, fetch, трассировки, CLI) позволяет подключать только нужное. Тесная интеграция с Claude Code, нативный anti-bot и CAPTCHA-solving в облаке делают его выбором №1 для команд, строящих AI-агентов с браузерными возможностями.
Основное ограничение — зависимость от платформы Browserbase: бесплатный тариф слишком мал для production, а серьёзная нагрузка требует подписки. Для одноразовых задач или разработки — вполне доступно.
Рейтинг: 8/10
| Критерий | Оценка |
|---|---|
| Простота интеграции | ⭐⭐⭐⭐⭐ |
| Функциональность | ⭐⭐⭐⭐⭐ |
| Документация | ⭐⭐⭐⭐ |
| Цена/качество | ⭐⭐⭐⭐ |
| Надёжность (alpha-фичи) | ⭐⭐⭐ |
Кому подойдёт:
- 🟢 Разработчикам, строящим AI-агентов с браузерными задачами
- 🟢 QA-инженерам, автоматизирующим регрессионное тестирование
- 🟢 Дата-инженерам, скрейпящим защищённые сайты
- 🔴 Тем, кто ищет полностью бесплатное и self-hosted решение без зависимостей