
Anthropic выпустила Claude Opus 4.8: честнее, быстрее, дешевле
Anthropic представила Claude Opus 4.8 — флагманскую модель с улучшенными бенчмарками, dynamic workflows и Fast Mode втрое дешевле. Доступна по прежней цене.
Главное за 30 секунд
Anthropicвыпустила Claude Opus 4.8 — обновление флагманской модели, которое улучшает показатели в кодировании и агентных задачах, делает модель честнее и вводит три крупные новые функции. Модель доступна с 28 мая 2026 года через Claude API, Amazon Bedrock, Google Cloud Vertex AI и Microsoft Foundry — по той же цене, что и Opus 4.7: $5/$25 за миллион токенов, при том же контекстном окне в 1 миллион токенов.
Что изменилось в бенчмарках
По бенчмаркам Opus 4.8 делает шаг вперёд, но не прыжок: SWE-bench Verified — 88,6% против 87,6% у Opus 4.7, SWE-bench Pro — 69,2% против 64,3%, Terminal-Bench 2.1 — 74,6% против 66,1%.
| Бенчмарк | Opus 4.7 | Opus 4.8 | GPT-5.5 |
|---|---|---|---|
| SWE-bench Verified | 87,6% | 88,6% | — |
| SWE-bench Pro (агентный код) | 64,3% | 69,2% | 58,6% |
| Terminal-Bench 2.1 | 66,1% | 74,6% | 78,2% |
| GPQA Diamond (наука) | 94,2% | 93,6% | — |
| Online-Mind2Web (браузер) | — | 84% | — |
| GDPval-AA (Elo, знания) | — | 1890 | 1769 |
Ключевое улучшение: честность модели
Главный акцент Anthropic при выпуске — не рост бенчмарков, а то, что модель перестала замалчивать собственные ошибки.
По данным Anthropic, Opus 4.8 примерно в четыре раза реже, чем Opus 4.7, пропускает баги в сгенерированном коде без предупреждения. Оценки выравнивания также достигли новых максимумов по просоциальным характеристикам, а частота нежелательного поведения по сравнению с Opus 4.7 существенно снизилась.
«Модель, которая сообщает о своей неуверенности, полезнее той, что уверенно даёт неверный ответ. Это улучшение накапливается в течение долгой рабочей сессии.»
По внутренней шкале Anthropic, Opus 4.8 находится между Opus 4.7 и более мощным Claude Mythos Preview, доступ к которому пока ограничен небольшим числом организаций в рамках проекта Glasswing.
Три новые функции
Dynamic Workflows — параллельные субагенты
graph TD
A[Задача пользователя] --> B[Claude планирует работу]
B --> C[Субагент 1]
B --> D[Субагент 2]
B --> E[Субагент N...]
C --> F[Верификатор]
D --> F
E --> F
F --> G[Итоговый ответ пользователю]
Dynamic Workflows позволяют Claude писать скрипты оркестрации, запускающие десятки и сотни параллельных субагентов — не более 16 одновременно и не более 1000 за один запуск. Паттерн создан для масштабных миграций кодовых баз, где узким местом является пропускная способность, а не само рассуждение.
Dynamic Workflows доступны в Claude Code для планов Enterprise, Team и Max.
Effort Control — управление усилием
Пользователи claude.ai и Cowork теперь могут выбирать, сколько «усилий» Claude вкладывает в ответ — от Low (быстрее, меньше расход лимита) до Max. По умолчанию Opus 4.8 работает на уровне High.
Fast Mode стал в 3 раза дешевле
Anthropic снизила цену Fast Mode — режима, в котором модель генерирует токены примерно в 2,5 раза быстрее — до $10 за миллион входных токенов и $50 за миллион выходных, тогда как для Opus 4.7 это стоило $30/$150. Для чувствительных к задержкам агентных рабочих процессов, которые раньше не могли позволить себе Fast Mode, экономика изменилась кардинально.
Изменения в API
Тихое, но значимое изменение для разработчиков: Messages API теперь принимает системные записи внутри массива сообщений, а не только в верхнеуровневом параметре system. Это позволяет обновлять инструкции в середине задачи без разрушения кэша промтов — то есть модель можно направлять в процессе работы, сохраняя кэшированные ставки на всё предыдущее.
# Переключиться на Opus 4.8 в Claude Code
/model claude-opus-4-8
# Включить Fast Mode
/fast
# Запустить с явным указанием модели и режима
claude --model claude-opus-4-8 --fast
Что говорят ранние тестировщики
Команда Cognition (разработчик Devin) заявила, что релиз «напрямую ускоряет прирост возможностей для инженеров», и отметила, что Opus 4.8 исправил проблемы с многословными комментариями и вызовами инструментов из 4.7. Поставщик computer-use решений сообщил о результате 84% на Online-Mind2Web — это заметный рост по сравнению как с Opus 4.7, так и с GPT-5.5.
Контекст и значение для отрасли
Mythos — более мощный класс моделей Anthropic — пока доступен только ограниченному числу партнёров. Запуск Opus 4.8 позиционируется как «самая мощная модель, доступная для Claude Code прямо сейчас», до выхода Mythos в широкий доступ в ближайшие недели.
Рост SWE-bench Pro с 64,3% до 69,2% — не косметическое изменение: в продакшн-агентах для кодирования пятипроцентный прирост на верхнем крае кривой возможностей, как правило, выражается в меньшем числе неудачных запусков, меньших ручных вмешательствах и более низкой итоговой стоимости выполненной задачи.
Для команд, уже использующих Opus 4.7, переход выглядит убедительно: та же цена, лучшие бенчмарки, радикально более доступный Fast Mode и новый инструментарий для задач, которые раньше требовали целой команды разработчиков. Opus 4.8 — это не революция, но плотная и практичная эволюция, которая меняет экономику агентных рабочих процессов уже сегодня.