Anthropic выпустила Claude Opus 4.8: честнее, быстрее, дешевле

Главное за 30 секунд

Anthropicвыпустила Claude Opus 4.8 — обновление флагманской модели, которое улучшает показатели в кодировании и агентных задачах, делает модель честнее и вводит три крупные новые функции. Модель доступна с 28 мая 2026 года через Claude API, Amazon Bedrock, Google Cloud Vertex AI и Microsoft Foundry — по той же цене, что и Opus 4.7: $5/$25 за миллион токенов, при том же контекстном окне в 1 миллион токенов.

ℹ Быстрый факт

Claude Opus 4.8 вышел всего через 41 день после Opus 4.7 — это самый быстрый цикл выпуска в серии Opus за всё время.

Что изменилось в бенчмарках

По бенчмаркам Opus 4.8 делает шаг вперёд, но не прыжок: SWE-bench Verified — 88,6% против 87,6% у Opus 4.7, SWE-bench Pro — 69,2% против 64,3%, Terminal-Bench 2.1 — 74,6% против 66,1%.

Бенчмарк	Opus 4.7	Opus 4.8	GPT-5.5
SWE-bench Verified	87,6%	88,6%	—
SWE-bench Pro (агентный код)	64,3%	69,2%	58,6%
Terminal-Bench 2.1	66,1%	74,6%	78,2%
GPQA Diamond (наука)	94,2%	93,6%	—
Online-Mind2Web (браузер)	—	84%	—
GDPval-AA (Elo, знания)	—	1890	1769

⚠ Где GPT-5.5 всё ещё впереди

На Terminal-Bench 2.1 GPT-5.5 набирает 78,2% против 74,6% у Opus 4.8. Если ваш рабочий процесс завязан на терминальных задачах в CLI, GPT-5.5 пока сильнее именно здесь.

Ключевое улучшение: честность модели

Главный акцент Anthropic при выпуске — не рост бенчмарков, а то, что модель перестала замалчивать собственные ошибки.

По данным Anthropic, Opus 4.8 примерно в четыре раза реже, чем Opus 4.7, пропускает баги в сгенерированном коде без предупреждения. Оценки выравнивания также достигли новых максимумов по просоциальным характеристикам, а частота нежелательного поведения по сравнению с Opus 4.7 существенно снизилась.

«Модель, которая сообщает о своей неуверенности, полезнее той, что уверенно даёт неверный ответ. Это улучшение накапливается в течение долгой рабочей сессии.»

По внутренней шкале Anthropic, Opus 4.8 находится между Opus 4.7 и более мощным Claude Mythos Preview, доступ к которому пока ограничен небольшим числом организаций в рамках проекта Glasswing.

Три новые функции

Dynamic Workflows — параллельные субагенты


graph TD
    A[Задача пользователя] --> B[Claude планирует работу]
    B --> C[Субагент 1]
    B --> D[Субагент 2]
    B --> E[Субагент N...]
    C --> F[Верификатор]
    D --> F
    E --> F
    F --> G[Итоговый ответ пользователю]

Dynamic Workflows позволяют Claude писать скрипты оркестрации, запускающие десятки и сотни параллельных субагентов — не более 16 одновременно и не более 1000 за один запуск. Паттерн создан для масштабных миграций кодовых баз, где узким местом является пропускная способность, а не само рассуждение.

Dynamic Workflows доступны в Claude Code для планов Enterprise, Team и Max.

Effort Control — управление усилием

Пользователи claude.ai и Cowork теперь могут выбирать, сколько «усилий» Claude вкладывает в ответ — от Low (быстрее, меньше расход лимита) до Max. По умолчанию Opus 4.8 работает на уровне High.

💡 Как экономить

Это важно для управления расходами: Low-режим на простых задачах и Max на сложных — это дисциплина, которая заметно снижает ежемесячный счёт без потери качества там, где оно важно.

Fast Mode стал в 3 раза дешевле

Anthropic снизила цену Fast Mode — режима, в котором модель генерирует токены примерно в 2,5 раза быстрее — до $10 за миллион входных токенов и $50 за миллион выходных, тогда как для Opus 4.7 это стоило $30/$150. Для чувствительных к задержкам агентных рабочих процессов, которые раньше не могли позволить себе Fast Mode, экономика изменилась кардинально.

Изменения в API

Тихое, но значимое изменение для разработчиков: Messages API теперь принимает системные записи внутри массива сообщений, а не только в верхнеуровневом параметре system. Это позволяет обновлять инструкции в середине задачи без разрушения кэша промтов — то есть модель можно направлять в процессе работы, сохраняя кэшированные ставки на всё предыдущее.

# Переключиться на Opus 4.8 в Claude Code
/model claude-opus-4-8

# Включить Fast Mode
/fast

# Запустить с явным указанием модели и режима
claude --model claude-opus-4-8 --fast

Что говорят ранние тестировщики

Команда Cognition (разработчик Devin) заявила, что релиз «напрямую ускоряет прирост возможностей для инженеров», и отметила, что Opus 4.8 исправил проблемы с многословными комментариями и вызовами инструментов из 4.7. Поставщик computer-use решений сообщил о результате 84% на Online-Mind2Web — это заметный рост по сравнению как с Opus 4.7, так и с GPT-5.5.

⚠ Важная оговорка

Системная карта Opus 4.8 фиксирует, что устойчивость к prompt-injection атакам в агентных сценариях несколько снизилась по сравнению с Opus 4.7: ~9,6% успешных атак против 6,0% у Opus 4.7. Командам, запускающим модель в агентных пайплайнах с ненадёжными входными данными, следует пересмотреть подход к изоляции среды.

Контекст и значение для отрасли

Mythos — более мощный класс моделей Anthropic — пока доступен только ограниченному числу партнёров. Запуск Opus 4.8 позиционируется как «самая мощная модель, доступная для Claude Code прямо сейчас», до выхода Mythos в широкий доступ в ближайшие недели.

Рост SWE-bench Pro с 64,3% до 69,2% — не косметическое изменение: в продакшн-агентах для кодирования пятипроцентный прирост на верхнем крае кривой возможностей, как правило, выражается в меньшем числе неудачных запусков, меньших ручных вмешательствах и более низкой итоговой стоимости выполненной задачи.

Для команд, уже использующих Opus 4.7, переход выглядит убедительно: та же цена, лучшие бенчмарки, радикально более доступный Fast Mode и новый инструментарий для задач, которые раньше требовали целой команды разработчиков. Opus 4.8 — это не революция, но плотная и практичная эволюция, которая меняет экономику агентных рабочих процессов уже сегодня.

Главное за 30 секунд

Что изменилось в бенчмарках

Ключевое улучшение: честность модели

Три новые функции

Dynamic Workflows — параллельные субагенты

Effort Control — управление усилием

Fast Mode стал в 3 раза дешевле

Изменения в API

Что говорят ранние тестировщики

Контекст и значение для отрасли

Источники

Похожие статьи

Claude отправляет пользователей спать прямо во время работы

Claude Sonnet 5: новый рубеж агентного AI от Anthropic

Что изменилось в системном промпте Claude Opus 4.7

Claude Sonnet 4.6: новый уровень AI для работы и кода

Обзор Claude 4: возможности, цены, сравнение с конкурентами