GPT-5.6 Sol: флагман нового поколения от OpenAI

26 июня 2026 года OpenAI официально анонсировала семейство моделей GPT-5.6 — следующий шаг в развитии крупных языковых моделей. В центре внимания — флагманская модель GPT-5.6 Sol, которая получила значительный прирост в трёх ключевых областях: программировании, кибербезопасности и биологических науках. Но релиз оказался нетривиальным: впервые в истории коммерческого ИИ правительство США потребовало поэтапного закрытого запуска.


Новая система именования: Sol, Terra, Luna

В новой системе именования, введённой с GPT-5.6, цифра обозначает поколение модели, а имена Sol, Terra и Luna — устойчивые уровни возможностей, которые могут развиваться в собственном темпе. Вместе семейство даёт разработчикам и пользователям более чёткий выбор по параметрам интеллекта, скорости и стоимости.

Три версии GPT-5.6 вдохновлены образами Солнца, Земли и Луны. Это не просто красивые имена — они отражают иерархию возможностей:

  • Sol («Солнце») — флагман для самых сложных задач
  • Terra («Земля») — сбалансированная модель для повседневной работы
  • Luna («Луна») — быстрая и доступная по цене
ℹ Что значит 'устойчивый уровень возможностей'?
OpenAI теперь разделяет понятие «поколение модели» и «уровень возможностей». Это означает, что Sol, Terra и Luna могут получать независимые обновления, не дожидаясь следующего поколения. Например, Terra может стать лучше уже в рамках GPT-5.6, не меняя названия.

Три модели — три сценария применения

Sol предназначен для самых сложных задач — комплексного программирования и security-исследований; Terra — для высокообъёмных бизнес-задач вроде поддержки клиентов, внутренних инструментов и анализа документов; Luna — для быстрой и недорогой повседневной работы: суммаризации, черновиков и рутинной автоматизации.

Terra показывает производительность, сопоставимую с GPT-5.5, при этом стоит вдвое дешевле, а Luna обеспечивает высокие возможности по минимальной цене.

Ценообразование API

GPT-5.6 тарифицируется за 1 млн токенов: Sol — $5 за входные / $30 за выходные; Terra — $2,50 / $15; Luna — $1 / $6.

МодельВходные токены ($/1M)Выходные токены ($/1M)Позиционирование
Sol$5$30Флагман, сложные задачи
Terra$2,50$15Баланс цены и качества
Luna$1$6Скорость и экономия

Для сравнения: GPT-5.6 Sol стоит примерно вдвое дешевле Claude Fable 5 от Anthropic, который оценивается в $10 за входные и $50 за выходные токены.


Новые режимы рассуждения: max и ultra

С GPT-5.6 OpenAI вводит новый режим максимального усилия рассуждения (max reasoning effort), предоставляя Sol максимальное время для глубокого обдумывания. Кроме того, представлен новый режим ultra, который выходит за рамки возможностей одного агента, задействуя субагентов для ускорения сложной работы.

Как это работает на практике?


graph LR
    A[Запрос пользователя] --> B{Режим?}
    B -->|max| C[Один агент\nГлубокое рассуждение\nДлинная цепочка CoT]
    B -->|ultra| D[Оркестратор]
    D --> E[Субагент 1]
    D --> F[Субагент 2]
    D --> G[Субагент 3]
    E --> H[Итоговый ответ]
    F --> H
    G --> H
    C --> H

Режим max углубляет единую цепочку рассуждений, тогда как ultra координирует нескольких «рабочих» для выполнения одной задачи.

💡 Когда использовать какой режим?

max — выбирайте для задач, требующих последовательной логики: математических доказательств, многошаговой отладки кода, юридического анализа.

ultra — идеален для параллельных рабочих процессов: одновременного анализа нескольких баз кода, крупных исследовательских проектов, автоматизации DevOps-пайплайнов.


Производительность: что говорят бенчмарки

Программирование: TerminalBench 2.1

В сфере программирования GPT-5.6 Sol устанавливает новый уровень на Terminal-Bench 2.1 — бенчмарке, проверяющем работу с командной строкой, требующую планирования, итерации и координации инструментов.

На TerminalBench 2.1 Sol Ultra набирает 91,91%, Sol — 88,8%, тогда как Claude Mythos 5 показывает 88%, а GPT-5.5 — 83,4%.

Агентные задачи: Agent’s Last Exam

На Agent’s Last Exam Sol — единственная модель, успешно преодолевшая отметку в 50% выполненных задач (50,9% в «режиме кода»), тогда как Luna также незначительно опережает флагман предыдущего поколения.

Биология: GeneBench v1

В тестах по количественной биологии и геномике Sol и Terra демонстрируют более высокую точность по сравнению с GPT-5.5 и GPT-5.4, при этом Sol достигает этих результатов при меньшем расходе токенов.

Кибербезопасность: ExploitBench и ExploitGym

На ExploitBench GPT-5.6 Sol конкурентоспособен с Mythos Preview, используя лишь ~1/3 выходных токенов.

На ExploitGym, бенчмарке, созданном исследователями Калифорнийского университета в Беркли в сотрудничестве с OpenAI и другими лабораториями, модели GPT-5.6 Sol, Terra и Luna демонстрируют значительное улучшение кибервозможностей по мере увеличения усилия рассуждения.

Сводная таблица бенчмарков

БенчмаркGPT-5.6 Sol (ultra)GPT-5.6 SolClaude Mythos 5GPT-5.5
TerminalBench 2.191,91%88,8%88,0%83,4%
Agent’s Last Exam (code)50,9%<50%
CTF (внутр.)96,7%
ExploitBench~Mythos (1/3 токенов)Mythos Preview

GPT-5.6 Sol в режиме ultra становится первой публичной моделью, превысившей 91% на TerminalBench 2.1 — одном из наиболее репрезентативных тестов для реальных инженерных задач.


Безопасность: самый продвинутый стек защиты

Рост возможностей неизбежно влечёт рост ответственности. OpenAI уделила особое внимание безопасности GPT-5.6.

GPT-5.6 Sol запускается с наиболее надёжным стеком безопасности компании на сегодняшний день. Усилена защита для высокорисковых действий, чувствительных киберзапросов и повторных злоупотреблений; команда несколько недель искала уязвимости, тестировала систему под нагрузкой и укрепляла её против реальных атак.

Модели обучены с учётом требований безопасности; для Sol и Terra добавлены новые классификаторы активаций, ориентированные на чувствительные домены: они следят за моделью и могут вмешаться, чтобы остановить небезопасный ответ прямо в процессе генерации.

⚠ Важно: кибервозможности не достигли критического порога
Согласно system card OpenAI, модели GPT-5.6 классифицируются как «Высокий» уровень возможностей в кибербезопасности, но не достигают порога «Критического». GPT-5.6 Sol и Terra способны находить уязвимости и фрагменты эксплойтов, однако в ходе тестирования не смогли провести автономные сквозные атаки на защищённые цели.

По мере роста возможностей модели средства защиты разработаны с учётом реального противодействия атакам, сохраняя при этом доступ к легитимным задачам: проверке кода, исследованию уязвимостей, разработке патчей, отладке, обучению безопасности и тестированию защиты.

На подготовку к запуску Sol OpenAI потратила более 700 000 GPU-часов эквивалента A100 на автоматизированное red teaming.


Prompt Caching: предсказуемость расходов для разработчиков

Помимо новых моделей, GPT-5.6 вводит обновлённый протокол кэширования контекста.

GPT-5.6 представляет более предсказуемое кэширование промптов, включая поддержку явных точек разрыва кэша и гарантированный минимальный срок жизни кэша 30 минут.

Первоначальная запись в кэш стоит 1,25× стандартной цены входных токенов, зато последующие чтения из кэша получают скидку 90%. На практике компании, выполняющие повторяющиеся операции, платят больше за создание кэша, но значительно меньше при каждом повторном использовании в течение минимум 30 минут.

# Пример использования явных breakpoints в Prompt Cache
client = openai.OpenAI()

response = client.chat.completions.create(
    model="gpt-5.6-sol",
    messages=[
        {
            "role": "system",
            # Длинный системный промпт — кэшируется до точки разрыва
            "content": long_system_prompt,
            "cache_control": {"type": "breakpoint"}  # явный breakpoint
        },
        {
            "role": "user",
            "content": user_query  # эта часть не кэшируется
        }
    ]
)

Для систем, которые регулярно передают в модель огромные окна контекста или определения кодовых баз, эта предсказуемость является критически важным финансовым ограничителем.


Скорость: GPT-5.6 Sol на Cerebras

OpenAI также анонсировала запуск GPT-5.6 Sol на платформе Cerebras в июле — со скоростью до 750 токенов в секунду, что принесёт передовой интеллект клиентам с беспрецедентной скоростью.

Для контекста: большинство современных облачных API обрабатывают 40–80 токенов в секунду. 750 токенов/с — это качественный скачок, особенно актуальный для агентных рабочих процессов реального времени.


Ограниченный доступ и позиция правительства США

OpenAI верит в широкий доступ и планирует сделать GPT-5.6 Sol, Terra и Luna общедоступными в ближайшие недели. В рамках продолжающегося взаимодействия с правительством США компания заблаговременно сообщила о своих планах и возможностях моделей.

Несколько изданий сообщают, что Офис национального киберсоветника Белого дома и Управление по науке и технологической политике попросили OpenAI предварительно показать модель небольшой группе проверенных правительством партнёров, пока администрация выстраивает процедуры тестирования и оценки.

Модели изначально доступны примерно двадцати организациям. OpenAI при этом открыто выразила несогласие с подобным подходом.

«Мы не считаем, что такой процесс государственного доступа должен стать долгосрочным стандартом. Он лишает лучших инструментов пользователей, разработчиков, предприятия, защитников киберпространства и международных партнёров, которым они нужны».

Это и есть главная история: не «новый чат-бот стал умнее». Суть в том, что передовой ИИ теперь настолько мощный, что стратегия выпуска, контроль доступа, государственная координация и инфраструктура безопасности становятся частью самого продукта.


Как выбрать подходящую модель из семейства GPT-5.6

📝 Практическое руководство по выбору

GPT-5.6 Luna — если вам нужна массовая обработка данных, суммаризация, первичные черновики, FAQ-боты. Экономия до 80% по сравнению с Sol.

GPT-5.6 Terra — замена GPT-5.5 для большинства бизнес-задач при вдвое меньшей стоимости. Оптимальный выбор для 80% production-сценариев.

GPT-5.6 Sol — когда важна максимальная точность рассуждений: сложный рефакторинг, security-аудит, научные исследования, агентные pipeline с длинным горизонтом.

Sol в режиме ultra — для параллельных многоагентных задач, требующих координации нескольких субагентов.


Заключение

GPT-5.6 Sol — это не просто следующая версия ChatGPT. Это заявка OpenAI на новый стандарт для frontier-моделей (моделей переднего края), где техническое превосходство неотделимо от зрелого подхода к безопасности.

Sol сравнивается или превосходит Claude Mythos 5 от Anthropic по бенчмаркам, имея явное преимущество в агентном программировании и лучшую токенную эффективность в кибербезопасности. При этом цена Sol вдвое ниже ближайшего конкурента, а семейство Terra/Luna открывает те же возможности для команд с ограниченным бюджетом.

Для российских разработчиков и команд, работающих с OpenAI API, практическая рекомендация такова: при переходе с GPT-5.5 Terra станет оптимальным первым шагом — она соответствует уровню GPT-5.5, стоя при этом примерно вдвое дешевле. Sol стоит рассматривать для задач, где качество рассуждений критично и оправдывает более высокую стоимость.

Общая доступность всех трёх моделей ожидается в ближайшие недели. Следите за обновлениями на ai-uchi.ru — мы опубликуем подробные тесты на практических задачах сразу после открытия доступа.