Главное за 30 секунд

Anthropicвыпустила Claude Opus 4.8 — обновление флагманской модели, которое улучшает показатели в кодировании и агентных задачах, делает модель честнее и вводит три крупные новые функции. Модель доступна с 28 мая 2026 года через Claude API, Amazon Bedrock, Google Cloud Vertex AI и Microsoft Foundry — по той же цене, что и Opus 4.7: $5/$25 за миллион токенов, при том же контекстном окне в 1 миллион токенов.

ℹ Быстрый факт
Claude Opus 4.8 вышел всего через 41 день после Opus 4.7 — это самый быстрый цикл выпуска в серии Opus за всё время.

Что изменилось в бенчмарках

По бенчмаркам Opus 4.8 делает шаг вперёд, но не прыжок: SWE-bench Verified — 88,6% против 87,6% у Opus 4.7, SWE-bench Pro — 69,2% против 64,3%, Terminal-Bench 2.1 — 74,6% против 66,1%.

БенчмаркOpus 4.7Opus 4.8GPT-5.5
SWE-bench Verified87,6%88,6%
SWE-bench Pro (агентный код)64,3%69,2%58,6%
Terminal-Bench 2.166,1%74,6%78,2%
GPQA Diamond (наука)94,2%93,6%
Online-Mind2Web (браузер)84%
GDPval-AA (Elo, знания)18901769
⚠ Где GPT-5.5 всё ещё впереди
На Terminal-Bench 2.1 GPT-5.5 набирает 78,2% против 74,6% у Opus 4.8. Если ваш рабочий процесс завязан на терминальных задачах в CLI, GPT-5.5 пока сильнее именно здесь.

Ключевое улучшение: честность модели

Главный акцент Anthropic при выпуске — не рост бенчмарков, а то, что модель перестала замалчивать собственные ошибки.

По данным Anthropic, Opus 4.8 примерно в четыре раза реже, чем Opus 4.7, пропускает баги в сгенерированном коде без предупреждения. Оценки выравнивания также достигли новых максимумов по просоциальным характеристикам, а частота нежелательного поведения по сравнению с Opus 4.7 существенно снизилась.

«Модель, которая сообщает о своей неуверенности, полезнее той, что уверенно даёт неверный ответ. Это улучшение накапливается в течение долгой рабочей сессии.»

По внутренней шкале Anthropic, Opus 4.8 находится между Opus 4.7 и более мощным Claude Mythos Preview, доступ к которому пока ограничен небольшим числом организаций в рамках проекта Glasswing.


Три новые функции

Dynamic Workflows — параллельные субагенты


graph TD
    A[Задача пользователя] --> B[Claude планирует работу]
    B --> C[Субагент 1]
    B --> D[Субагент 2]
    B --> E[Субагент N...]
    C --> F[Верификатор]
    D --> F
    E --> F
    F --> G[Итоговый ответ пользователю]

Dynamic Workflows позволяют Claude писать скрипты оркестрации, запускающие десятки и сотни параллельных субагентов — не более 16 одновременно и не более 1000 за один запуск. Паттерн создан для масштабных миграций кодовых баз, где узким местом является пропускная способность, а не само рассуждение.

Dynamic Workflows доступны в Claude Code для планов Enterprise, Team и Max.

Effort Control — управление усилием

Пользователи claude.ai и Cowork теперь могут выбирать, сколько «усилий» Claude вкладывает в ответ — от Low (быстрее, меньше расход лимита) до Max. По умолчанию Opus 4.8 работает на уровне High.

💡 Как экономить
Это важно для управления расходами: Low-режим на простых задачах и Max на сложных — это дисциплина, которая заметно снижает ежемесячный счёт без потери качества там, где оно важно.

Fast Mode стал в 3 раза дешевле

Anthropic снизила цену Fast Mode — режима, в котором модель генерирует токены примерно в 2,5 раза быстрее — до $10 за миллион входных токенов и $50 за миллион выходных, тогда как для Opus 4.7 это стоило $30/$150. Для чувствительных к задержкам агентных рабочих процессов, которые раньше не могли позволить себе Fast Mode, экономика изменилась кардинально.


Изменения в API

Тихое, но значимое изменение для разработчиков: Messages API теперь принимает системные записи внутри массива сообщений, а не только в верхнеуровневом параметре system. Это позволяет обновлять инструкции в середине задачи без разрушения кэша промтов — то есть модель можно направлять в процессе работы, сохраняя кэшированные ставки на всё предыдущее.

# Переключиться на Opus 4.8 в Claude Code
/model claude-opus-4-8

# Включить Fast Mode
/fast

# Запустить с явным указанием модели и режима
claude --model claude-opus-4-8 --fast

Что говорят ранние тестировщики

Команда Cognition (разработчик Devin) заявила, что релиз «напрямую ускоряет прирост возможностей для инженеров», и отметила, что Opus 4.8 исправил проблемы с многословными комментариями и вызовами инструментов из 4.7. Поставщик computer-use решений сообщил о результате 84% на Online-Mind2Web — это заметный рост по сравнению как с Opus 4.7, так и с GPT-5.5.

⚠ Важная оговорка
Системная карта Opus 4.8 фиксирует, что устойчивость к prompt-injection атакам в агентных сценариях несколько снизилась по сравнению с Opus 4.7: ~9,6% успешных атак против 6,0% у Opus 4.7. Командам, запускающим модель в агентных пайплайнах с ненадёжными входными данными, следует пересмотреть подход к изоляции среды.

Контекст и значение для отрасли

Mythos — более мощный класс моделей Anthropic — пока доступен только ограниченному числу партнёров. Запуск Opus 4.8 позиционируется как «самая мощная модель, доступная для Claude Code прямо сейчас», до выхода Mythos в широкий доступ в ближайшие недели.

Рост SWE-bench Pro с 64,3% до 69,2% — не косметическое изменение: в продакшн-агентах для кодирования пятипроцентный прирост на верхнем крае кривой возможностей, как правило, выражается в меньшем числе неудачных запусков, меньших ручных вмешательствах и более низкой итоговой стоимости выполненной задачи.

Для команд, уже использующих Opus 4.7, переход выглядит убедительно: та же цена, лучшие бенчмарки, радикально более доступный Fast Mode и новый инструментарий для задач, которые раньше требовали целой команды разработчиков. Opus 4.8 — это не революция, но плотная и практичная эволюция, которая меняет экономику агентных рабочих процессов уже сегодня.