System Card GPT-5.5 Instant: безопасность и возможности
Разбираем System Card GPT-5.5 Instant: новый уровень кибербезопасности, снижение галлюцинаций, HealthBench и защитные механизмы OpenAI.
System Card GPT-5.5 Instant: что изменилось в безопасности и возможностях
OpenAI опубликовала System Card (карту системы — документ, описывающий возможности, ограничения и меры безопасности модели) для GPT-5.5 Instant. Это не просто формальная бумага: именно этот документ определяет, как именно тысячи правил, красных линий и защитных механизмов встроены в модель, которую ежедневно используют сотни миллионов людей.
OpenAI сменила движок внутри ChatGPT: начиная с сегодняшнего дня GPT-5.5 Instant заменяет GPT-5.3 Instant в качестве модели по умолчанию для сотен миллионов пользователей.
Что такое GPT-5.5 Instant и зачем нужна эта версия
GPT-5.5 — новая модель, созданная для решения сложных реальных задач: написания и отладки кода, поиска информации в интернете, анализа данных, создания документов и таблиц. По сравнению с предыдущими моделями GPT-5.5 быстрее понимает суть задачи, реже просит дополнительных уточнений, эффективнее использует инструменты и продолжает работу, пока задача не будет выполнена.
GPT-семейство OpenAI выстроено по уровням: Instant — повседневная модель, ориентированная на скорость и общее применение; Thinking — более медленный аналитический вариант для сложных задач; Pro — мощнейший инструмент для задач максимальной сложности.
GPT-5.5 Instant — другой зверь: он справляется с «базовыми» вещами вроде планирования питания или составления черновиков писем, но не предназначен для автономных многоэтапных пайплайнов кода.
GPT-5.5 Instant — это то, чем пользуется большинство людей, открывая ChatGPT. Именно поэтому его безопасность важна как никогда.
Снижение галлюцинаций: ключевой прорыв
Галлюцинации (hallucinations — уверенные, но фактически неверные утверждения модели) оставались главной проблемой ChatGPT с самого начала. GPT-5.5 Instant делает здесь значительный шаг вперёд.
Согласно внутренним тестам OpenAI, новая модель произвела на 52,5% меньше галлюцинированных утверждений по сравнению с предшественником на запросах из области медицины, права и финансов.
OpenAI также тестировала модель на реальных разговорах, которые пользователи предыдущих версий отмечали как содержащие фактические ошибки. На этих примерах число недостоверных утверждений сократилось на 37,3%.
Внутренние данные показывают: отдельные утверждения GPT-5.5 на 23% чаще оказываются фактически корректными. При этом модель в среднем делает больше утверждений на ответ, чем GPT-5.4, что объясняет расхождение между улучшением на уровне утверждений и на уровне ответов в целом.
Результаты HealthBench
HealthBench — независимый бенчмарк (набор тестов), оценивающий качество ответов ИИ на медицинские вопросы по шкале от 0 до 100.
На HealthBench GPT-5.5 Instant набирает 51,4 балла против 49,6 у предыдущей версии.
По данным OpenAI, GPT-5.5 имеет скорректированный по длине ответа HealthBench-балл 56,5 (+2,5 относительно GPT-5.4), HealthBench Hard — 31,5 (+2,4), HealthBench Consensus — 95,6 (-0,7) и HealthBench Professional — 51,8 (+3,7).
Как устроена безопасность GPT-5.5: уровни и фреймворк
Preparedness Framework
OpenAI использует собственный Preparedness Framework (фреймворк готовности — система оценки рисков передовых моделей). Каждая новая модель проходит классификацию по нескольким чувствительным доменам: уровни опасности — от «Medium» до «Critical».
graph TD
A[Новая модель GPT-5.5] --> B[Preparedness Framework]
B --> C{Оценка доменов}
C --> D[Кибербезопасность]
C --> E[Биология и химия]
C --> F[Прочие домены]
D --> G[Уровень: HIGH]
E --> H[Уровень: HIGH]
F --> I[Уровень: Medium]
G --> J[Усиленные защитные меры]
H --> J
J --> K[Выпуск модели с ограничениями]
OpenAI классифицирует возможности GPT-5.5 в области биологии/химии и кибербезопасности как «High» (высокий) в рамках Preparedness Framework. При этом уровня «Critical» по кибербезопасности модель не достигла, хотя её возможности в этом домене заметно превосходят GPT-5.4.
GPT-5.5 Instant стал первой моделью уровня Instant, которую OpenAI классифицирует как «High Capability» сразу в двух доменах — кибербезопасности и биологии — что требует применения дополнительных защитных мер при развёртывании.
Кибербезопасность: двойное использование
На бенчмарке CyberGym GPT-5.5 набирает 81,8% (против 79,0% у GPT-5.4), на внутренних CTF-задачах (Capture the Flag — соревнования по взлому) — 88,1% (против 83,7%).
Тем не менее GPT-5.5 самостоятельно не создал работающего полноцепочечного эксплойта против реальных целей. Главным ограничением стал не широкий поиск, а суждение при разработке эксплойтов: решение о том, какие направления заслуживают глубоких инвестиций, превращение сбоев в управляемые примитивы и отсеивание диагностических ошибок.
OpenAI расширяет доступ для ускорения киберзащиты: через программу Trusted Access for Cyber (доверенный доступ для кибербезопасности) верифицированные пользователи получают расширенный доступ к функциям кибербезопасности GPT-5.5 с меньшим количеством ограничений.
Биология: Bug Bounty программа
В рамках усилий по укреплению защиты в биологической области OpenAI запускает программу Bio Bug Bounty для GPT-5.5 и принимает заявки от исследователей с опытом в ИИ-красном тимировании, безопасности или биобезопасности.
Задача программы — выявить единый универсальный джейлбрейк (обход ограничений), способный ответить на все пять вопросов биобезопасности без модерации. Приём заявок открыт с 23 апреля по 22 июня 2026 года, тестирование продлится до 27 июля 2026 года.
Сравнение моделей: GPT-5.5 vs GPT-5.4
| Параметр | GPT-5.4 | GPT-5.5 Instant |
|---|---|---|
| Terminal-Bench 2.0 | 75,1% | 82,7% |
| CyberGym | 79,0% | 81,8% |
| CTF-задачи | 83,7% | 88,1% |
| HealthBench | ~49,6 | 51,4 |
| HealthBench Hard | 29,1 | 31,5 |
| HealthBench Professional | 48,1 | 51,8 |
| Снижение галлюцинаций | Базовый | −52,5% (vs GPT-5.3) |
| API-цена (вход/выход) | $2,50 / $15 | $5 / $30 |
Цена в API выросла вдвое — с $2,50/$15 до $5/$30 за миллион токенов. Однако OpenAI утверждает, что реальный рост затрат составит около 20%, поскольку GPT-5.5 использует примерно на 40% меньше выходных токенов на задачу в Codex.
Как проходила предрелизная проверка безопасности
Модель прошла полный набор предрелизных проверок безопасности и Preparedness Framework, включая целенаправленное red-teaming (тестирование на взлом) по направлениям кибербезопасности и биологии, а также сбор отзывов о реальных сценариях использования почти от 200 партнёров с ранним доступом.
System Card была обновлена 24 апреля 2026 года и включает дополнительную информацию о защитных мерах для развёртывания GPT-5.5 и GPT-5.5 Pro через API.
Как и другие модели OpenAI, GPT-5.5 обучался на разнообразных наборах данных: общедоступных материалах из интернета, данных от партнёров и информации, предоставленной пользователями или исследователями.
Доступность и планы
GPT-5.5 доступен для пользователей Plus, Pro, Business и Enterprise в ChatGPT и Codex, а GPT-5.5 Pro — для пользователей Pro, Business и Enterprise в ChatGPT.
Начиная с 24 апреля 2026 года GPT-5.5 и GPT-5.5 Pro также доступны через API.
GPT-5.5 и GPT-5.5 Pro доступны через Responses API и Chat Completions API — оба с контекстным окном в один миллион токенов.
Итог: баланс возможностей и безопасности
GPT-5.5 Instant — это первая «повседневная» модель OpenAI, которая одновременно достигла уровня «High» по двум наиболее чувствительным доменам безопасности. Это меняет само представление о том, что значит «стандартная» модель для миллионов пользователей.
OpenAI выпускает GPT-5.5 с самым мощным на сегодняшний день набором защитных мер, призванных снизить риск злоупотреблений, сохраняя при этом доступ к законным и полезным применениям продвинутых возможностей.
Жизнеспособный путь — доверенный доступ, надёжные защитные меры, масштабируемые по мере роста возможностей, и операционный потенциал для обнаружения серьёзных злоупотреблений и реагирования на них.
System Card GPT-5.5 Instant — это не просто отчёт о безопасности. Это манифест нового этапа: когда самая массовая модель начинает работать на уровне, который ещё год назад требовал специальных исследовательских версий.