System Card GPT-5.5 Instant: что изменилось в безопасности и возможностях

OpenAI опубликовала System Card (карту системы — документ, описывающий возможности, ограничения и меры безопасности модели) для GPT-5.5 Instant. Это не просто формальная бумага: именно этот документ определяет, как именно тысячи правил, красных линий и защитных механизмов встроены в модель, которую ежедневно используют сотни миллионов людей.

OpenAI сменила движок внутри ChatGPT: начиная с сегодняшнего дня GPT-5.5 Instant заменяет GPT-5.3 Instant в качестве модели по умолчанию для сотен миллионов пользователей.

ℹ Что такое System Card?

System Card — это официальный технический документ OpenAI, в котором описываются возможности модели, результаты тестирования безопасности, выявленные риски и принятые защитные меры. Он публикуется одновременно с выходом модели и обновляется при существенных изменениях.

Что такое GPT-5.5 Instant и зачем нужна эта версия

GPT-5.5 — новая модель, созданная для решения сложных реальных задач: написания и отладки кода, поиска информации в интернете, анализа данных, создания документов и таблиц. По сравнению с предыдущими моделями GPT-5.5 быстрее понимает суть задачи, реже просит дополнительных уточнений, эффективнее использует инструменты и продолжает работу, пока задача не будет выполнена.

GPT-семейство OpenAI выстроено по уровням: Instant — повседневная модель, ориентированная на скорость и общее применение; Thinking — более медленный аналитический вариант для сложных задач; Pro — мощнейший инструмент для задач максимальной сложности.

GPT-5.5 Instant — другой зверь: он справляется с «базовыми» вещами вроде планирования питания или составления черновиков писем, но не предназначен для автономных многоэтапных пайплайнов кода.

GPT-5.5 Instant — это то, чем пользуется большинство людей, открывая ChatGPT. Именно поэтому его безопасность важна как никогда.

Снижение галлюцинаций: ключевой прорыв

Галлюцинации (hallucinations — уверенные, но фактически неверные утверждения модели) оставались главной проблемой ChatGPT с самого начала. GPT-5.5 Instant делает здесь значительный шаг вперёд.

Согласно внутренним тестам OpenAI, новая модель произвела на 52,5% меньше галлюцинированных утверждений по сравнению с предшественником на запросах из области медицины, права и финансов.

OpenAI также тестировала модель на реальных разговорах, которые пользователи предыдущих версий отмечали как содержащие фактические ошибки. На этих примерах число недостоверных утверждений сократилось на 37,3%.

Внутренние данные показывают: отдельные утверждения GPT-5.5 на 23% чаще оказываются фактически корректными. При этом модель в среднем делает больше утверждений на ответ, чем GPT-5.4, что объясняет расхождение между улучшением на уровне утверждений и на уровне ответов в целом.

Результаты HealthBench

HealthBench — независимый бенчмарк (набор тестов), оценивающий качество ответов ИИ на медицинские вопросы по шкале от 0 до 100.

На HealthBench GPT-5.5 Instant набирает 51,4 балла против 49,6 у предыдущей версии.

По данным OpenAI, GPT-5.5 имеет скорректированный по длине ответа HealthBench-балл 56,5 (+2,5 относительно GPT-5.4), HealthBench Hard — 31,5 (+2,4), HealthBench Consensus — 95,6 (-0,7) и HealthBench Professional — 51,8 (+3,7).

💡 Что означают эти цифры?

HealthBench Consensus отражает согласованность ответов модели с профессиональным медицинским мнением. Показатель 95,6 означает, что в 95,6% случаев ответы ИИ совпадают с позицией врачей-экспертов — это очень высокий уровень надёжности для медицинских консультаций.

Как устроена безопасность GPT-5.5: уровни и фреймворк

Preparedness Framework

OpenAI использует собственный Preparedness Framework (фреймворк готовности — система оценки рисков передовых моделей). Каждая новая модель проходит классификацию по нескольким чувствительным доменам: уровни опасности — от «Medium» до «Critical».


graph TD
    A[Новая модель GPT-5.5] --> B[Preparedness Framework]
    B --> C{Оценка доменов}
    C --> D[Кибербезопасность]
    C --> E[Биология и химия]
    C --> F[Прочие домены]
    D --> G[Уровень: HIGH]
    E --> H[Уровень: HIGH]
    F --> I[Уровень: Medium]
    G --> J[Усиленные защитные меры]
    H --> J
    J --> K[Выпуск модели с ограничениями]

OpenAI классифицирует возможности GPT-5.5 в области биологии/химии и кибербезопасности как «High» (высокий) в рамках Preparedness Framework. При этом уровня «Critical» по кибербезопасности модель не достигла, хотя её возможности в этом домене заметно превосходят GPT-5.4.

GPT-5.5 Instant стал первой моделью уровня Instant, которую OpenAI классифицирует как «High Capability» сразу в двух доменах — кибербезопасности и биологии — что требует применения дополнительных защитных мер при развёртывании.

Кибербезопасность: двойное использование

На бенчмарке CyberGym GPT-5.5 набирает 81,8% (против 79,0% у GPT-5.4), на внутренних CTF-задачах (Capture the Flag — соревнования по взлому) — 88,1% (против 83,7%).

Тем не менее GPT-5.5 самостоятельно не создал работающего полноцепочечного эксплойта против реальных целей. Главным ограничением стал не широкий поиск, а суждение при разработке эксплойтов: решение о том, какие направления заслуживают глубоких инвестиций, превращение сбоев в управляемые примитивы и отсеивание диагностических ошибок.

OpenAI расширяет доступ для ускорения киберзащиты: через программу Trusted Access for Cyber (доверенный доступ для кибербезопасности) верифицированные пользователи получают расширенный доступ к функциям кибербезопасности GPT-5.5 с меньшим количеством ограничений.

⚠ Важно понимать

Возможности кибербезопасности в GPT-5.5 — это «двойное использование»: те же навыки, что помогают защитникам находить уязвимости, могут быть использованы злоумышленниками. Именно поэтому OpenAI вводит расширенные меры мониторинга и блокировки подозрительных запросов.

Биология: Bug Bounty программа

В рамках усилий по укреплению защиты в биологической области OpenAI запускает программу Bio Bug Bounty для GPT-5.5 и принимает заявки от исследователей с опытом в ИИ-красном тимировании, безопасности или биобезопасности.

Задача программы — выявить единый универсальный джейлбрейк (обход ограничений), способный ответить на все пять вопросов биобезопасности без модерации. Приём заявок открыт с 23 апреля по 22 июня 2026 года, тестирование продлится до 27 июля 2026 года.

Сравнение моделей: GPT-5.5 vs GPT-5.4

Параметр	GPT-5.4	GPT-5.5 Instant
Terminal-Bench 2.0	75,1%	82,7%
CyberGym	79,0%	81,8%
CTF-задачи	83,7%	88,1%
HealthBench	~49,6	51,4
HealthBench Hard	29,1	31,5
HealthBench Professional	48,1	51,8
Снижение галлюцинаций	Базовый	−52,5% (vs GPT-5.3)
API-цена (вход/выход)	$2,50 / $15	$5 / $30

Цена в API выросла вдвое — с $2,50/$15 до $5/$30 за миллион токенов. Однако OpenAI утверждает, что реальный рост затрат составит около 20%, поскольку GPT-5.5 использует примерно на 40% меньше выходных токенов на задачу в Codex.

Как проходила предрелизная проверка безопасности

Модель прошла полный набор предрелизных проверок безопасности и Preparedness Framework, включая целенаправленное red-teaming (тестирование на взлом) по направлениям кибербезопасности и биологии, а также сбор отзывов о реальных сценариях использования почти от 200 партнёров с ранним доступом.

System Card была обновлена 24 апреля 2026 года и включает дополнительную информацию о защитных мерах для развёртывания GPT-5.5 и GPT-5.5 Pro через API.

Как и другие модели OpenAI, GPT-5.5 обучался на разнообразных наборах данных: общедоступных материалах из интернета, данных от партнёров и информации, предоставленной пользователями или исследователями.

📝 Пример: что проверяли тестировщики

Внешние red-teamers в ходе тестирования GPT-5.5 проверяли: способность модели провести многодневную кампанию по поиску уязвимостей, генерировать proof-of-concept входные данные для эксплойтов, а также выполнять анализ корневых причин сбоев — всё это под контролем и с периодическим перенаправлением операторов.

Доступность и планы

GPT-5.5 доступен для пользователей Plus, Pro, Business и Enterprise в ChatGPT и Codex, а GPT-5.5 Pro — для пользователей Pro, Business и Enterprise в ChatGPT.

Начиная с 24 апреля 2026 года GPT-5.5 и GPT-5.5 Pro также доступны через API.

GPT-5.5 и GPT-5.5 Pro доступны через Responses API и Chat Completions API — оба с контекстным окном в один миллион токенов.

Итог: баланс возможностей и безопасности

GPT-5.5 Instant — это первая «повседневная» модель OpenAI, которая одновременно достигла уровня «High» по двум наиболее чувствительным доменам безопасности. Это меняет само представление о том, что значит «стандартная» модель для миллионов пользователей.

OpenAI выпускает GPT-5.5 с самым мощным на сегодняшний день набором защитных мер, призванных снизить риск злоупотреблений, сохраняя при этом доступ к законным и полезным применениям продвинутых возможностей.

Жизнеспособный путь — доверенный доступ, надёжные защитные меры, масштабируемые по мере роста возможностей, и операционный потенциал для обнаружения серьёзных злоупотреблений и реагирования на них.

System Card GPT-5.5 Instant — это не просто отчёт о безопасности. Это манифест нового этапа: когда самая массовая модель начинает работать на уровне, который ещё год назад требовал специальных исследовательских версий.

System Card GPT-5.5 Instant: безопасность и возможности

System Card GPT-5.5 Instant: что изменилось в безопасности и возможностях

Что такое GPT-5.5 Instant и зачем нужна эта версия

Снижение галлюцинаций: ключевой прорыв

Результаты HealthBench

Как устроена безопасность GPT-5.5: уровни и фреймворк

Preparedness Framework

Кибербезопасность: двойное использование

Биология: Bug Bounty программа

Сравнение моделей: GPT-5.5 vs GPT-5.4

Как проходила предрелизная проверка безопасности

Доступность и планы

Итог: баланс возможностей и безопасности

Источники

System Card GPT-5.5 Instant: что изменилось в безопасности и возможностях

Что такое GPT-5.5 Instant и зачем нужна эта версия

Снижение галлюцинаций: ключевой прорыв

Результаты HealthBench

Как устроена безопасность GPT-5.5: уровни и фреймворк

Preparedness Framework

Кибербезопасность: двойное использование

Биология: Bug Bounty программа

Сравнение моделей: GPT-5.5 vs GPT-5.4

Как проходила предрелизная проверка безопасности

Доступность и планы

Итог: баланс возможностей и безопасности

Источники

Похожие статьи

GPT-5.5 Instant: умнее, точнее, персональнее

Trusted Contact в ChatGPT: новая функция безопасности OpenAI

GPT-5.5-Cyber: ИИ на страже кибербезопасности

ChatGPT теперь управляет вашими финансами: обзор новой функции

Кибербезопасность в эпоху ИИ: план OpenAI