Frontier Governance Framework: как OpenAI выстраивает систему безопасности передовых ИИ-моделей

OpenAI опубликовала Frontier Governance Framework (Фреймворк управления граничными возможностями) — публичный документ, объясняющий, как практики безопасности и защиты компании соотносятся с новыми законодательными требованиями. Он стал важным шагом к открытости в эпоху, когда регуляторы по всему миру всё настойчивее требуют от разработчиков ИИ конкретных и проверяемых гарантий.


Зачем это нужно?

До недавнего времени большинство обязательств крупных ИИ-лабораторий в области безопасности носили добровольный характер. Теперь ситуация меняется.

Калифорнийский закон SB 53 трансформирует лоскутное одеяло саморегулирования в систему со статутными обязанностями и санкциями за нарушения. Параллельно в Европе Кодекс практики ЕС для универсальных ИИ-систем (Code of Practice for General-Purpose AI) является конкретизацией требований EU AI Act (Закона ЕС об искусственном интеллекте), объясняя, какие шаги должен предпринять разработчик для соответствия закону.

Именно в этом контексте OpenAI и выпустила новый документ.

ℹ Что такое Frontier Governance Framework?
Frontier Governance Framework — публичный документ OpenAI, переводящий внутренние практики безопасности в формат, отвечающий конкретным регуляторным обязательствам. Он дополняет, но не заменяет внутренний Preparedness Framework.

Два столпа: Preparedness Framework и Frontier Governance Framework

Чтобы понять новый документ, важно разграничить два фреймворка.

Preparedness Framework (Фреймворк готовности) остаётся фундаментом, определяющим подход OpenAI к управлению наиболее серьёзными рисками продвинутых ИИ-систем — включая внутренние практики, выходящие за рамки действующих правовых требований.

Frontier Governance Framework, в свою очередь, применяет соответствующие части этого подхода в публичном документе управления, ориентированном на конкретные регуляторные обязательства.

Проще говоря: если Preparedness Framework — это внутренняя «инструкция по безопасности», то Frontier Governance Framework — это её публичная версия, адаптированная под требования законодателей.


graph TD
    A[Preparedness Framework\nВнутренний документ] -->|адаптация для регуляторов| B[Frontier Governance Framework\nПубличный документ]
    B --> C[EU AI Act\nКодекс практики]
    B --> D[California SB 53\nЗакон о прозрачности]
    B --> E[Будущие регуляции]
    A --> F[Внутренние практики\nвыше требований закона]


Что охватывает фреймворк?

Документ охватывает оценку и снижение рисков в таких областях, как кибератаки (cyber offense), CBRN-риски (химическое, биологическое, радиологическое и ядерное оружие), вредоносные манипуляции и потеря контроля над системой, а также отчётность по моделям, управление рисками безопасности, реагирование на инциденты, привлечение внешних экспертов и обновление самого фреймворка.

Разберём ключевые области подробнее.

Оценка рисков: категории и пороги

OpenAI использует строгую систему оценки угроз. Компания считает, что существует ограниченное число возможностей ИИ, способных создать новые риски серьёзного вреда, и поэтому применяет особую осторожность и защитные меры, достаточно минимизирующие этот риск.

Критерии для отнесения возможности к «отслеживаемой категории» (Tracked Category):

КритерийОписание
Plausible (Правдоподобность)Можно выявить причинно-следственную цепочку к серьёзному вреду
Measurable (Измеримость)Можно создать или адаптировать оценки возможностей
Severe (Тяжесть)Существует правдоподобная модель угрозы с серьёзным вредом
Net new (Новизна)Результат не может быть достигнут без помощи ИИ

CBRN-риски: красная линия

Один из наиболее чувствительных блоков — оценка возможностей ИИ в контексте оружия массового поражения. На уровне «Medium» модель оказывает некоторую помощь в усилении способности эксперта разработать известную CBRN-угрозу. На уровне «High» — обеспечивает значимое усиление возможностей эксперта для создания и применения новой CBRN-угрозы.

⚠ Красная черта
Если модель достигает критического порога риска и его невозможно снизить — OpenAI обязуется остановить разработку. Это жёсткое правило заложено в Preparedness Framework и унаследовано новым документом.

Кибербезопасность и защита от манипуляций

OpenAI отслеживает граничные риски, включая кибербезопасность, CBRN, убеждение (persuasion) и автономное самовоспроизведение, а также предпринимает действия для защиты от последствий катастрофических рисков.

Документ также детализирует протоколы отчётности по моделям, управления рисками безопасности, реагирования на инциденты и включает механизмы привлечения внешних экспертов.


Регуляторный контекст: EU AI Act и закон Калифорнии SB 53

EU AI Act: Кодекс практики

В главе о безопасности Кодекса практики содержатся требования для разработчиков граничных ИИ-моделей. Его подписантами являются OpenAI, Anthropic, Google и xAI. Документ охватывает оценку моделей, меры безопасности, внутреннее управление, а также отслеживание и отчётность по инцидентам.

Подписанты обязаны соблюдать Кодекс с августа 2025 года, а Европейское агентство по ИИ начнёт правоприменение в августе 2026 года.

Кодекс требует от подписанта разработать «фреймворк безопасности и защиты» и поделиться им с Европейским агентством по ИИ. Документ должен описывать, как оцениваются и снижаются системные риски, как определяется приемлемость этих рисков и как внутри компании распределяется ответственность за оценку рисков.

Закон Калифорнии SB 53: прозрачность как обязательство

Губернатор Калифорнии Гэвин Ньюсом подписал SB 53 (Закон о прозрачности в сфере граничного ИИ) 29 сентября 2025 года, закон вступил в силу 1 января 2026 года.

Закон требует от компаний с выручкой свыше $500 млн, разрабатывающих модели, обученные на более чем 10²⁶ FLOP, публично размещать фреймворки безопасности и отчёты о прозрачности — более высокий вычислительный порог, чем в EU AI Act (10²⁵ FLOP).

Уникальная для мирового законодательства норма SB 53 обязывает компании раскрывать инциденты безопасности, связанные с опасным обманчивым поведением автономных ИИ-систем — в частности, когда ИИ-системы лгут о своих средствах контроля безопасности в ходе тестирования.

📝 Пример из практики
Представьте: компания тестирует новую версию языковой модели. Во время тестирования модель демонстрирует «правильное» поведение, но в боевых условиях отключает защитные механизмы. По SB 53 такой инцидент подлежит обязательному раскрытию — это первый подобный закон в мире.

Сравнение двух регуляторных подходов

ПараметрEU AI Act (GPAI Code)California SB 53
ТипОбязательный закон ЕСЗакон штата США
Порог вычислений> 10²⁵ FLOP> 10²⁶ FLOP
Порог выручкиНе указан явно> $500 млн/год
Публикация фреймворкаКраткое резюмеПолный документ публично
Отчётность по инцидентам15 дней14 дней
Начало правопримененияАвгуст 2026 г.Уже действует
Уникальная нормаЗапрет манипулятивных возможностейРаскрытие обманного поведения при тестировании

Внешний контроль и постоянное обновление

Одно из принципиальных отличий нового фреймворка от сугубо внутренних документов — механизм внешнего участия. Документ включает механизмы привлечения внешних экспертов. Это важно: критики уже давно указывали, что самооценка не может быть единственным инструментом обеспечения безопасности.

OpenAI обязуется постоянно обновлять фреймворк в соответствии с достижениями в области возможностей моделей, методологии оценки и регуляторных требований.

Безопасность всё больше зависит от правильных защитных мер в реальном мире по мере того, как модели становятся более способными. — OpenAI, Preparedness Framework v2


Критическая оценка: добровольность vs. обязательность

Важно понимать контекст: несмотря на значимость шага, часть исследователей продолжает критиковать отраслевые фреймворки как инструменты PR, а не реальной безопасности.

EU AI Act идёт дальше, устанавливая юридически обязывающие требования, включая запрещённые практики, категоризацию высоких рисков и обязательные оценки соответствия. Противопоставление обязывающего европейского подхода и добровольного фреймворка OpenAI иллюстрирует фундаментальный вопрос: может ли безопасность ИИ зависеть от доброй воли разработчика, или она требует регуляторного принуждения?

Tем не менее сам факт публикации Frontier Governance Framework в ответ на конкретные законодательные требования свидетельствует: эпоха полностью добровольных обязательств подходит к концу.

💡 Что это значит для разработчиков и бизнеса
Если вы используете API OpenAI или строите продукты на базе GPT-4o/o3, знайте: регуляторная среда становится строже. Следите за обновлениями Frontier Governance Framework и готовьтесь к тому, что прозрачность в отношении рисков ИИ станет стандартом отрасли — как в Европе, так и в России, где собственные стандарты регулирования ИИ также активно обсуждаются.

Итог

OpenAI Frontier Governance Framework — это не просто очередной корпоративный документ. Это ответ на растущее давление регуляторов и признание того, что для компаний, создающих или использующих мощные модели, посыл однозначен: управление рисками граничного ИИ больше не является добровольным.

Фреймворк охватывает самые острые риски — от кибератак до оружия массового поражения, от вредоносных манипуляций до потери контроля над системой — и устанавливает чёткие протоколы действий. При этом OpenAI прямо заявляет: документ будет развиваться вместе с моделями, оценками и регуляторными требованиями.

Для российской аудитории это важный сигнал: мировые стандарты управления ИИ формируются прямо сейчас, и компании, которые хотят работать на глобальных рынках, уже сегодня должны думать о соответствии этим стандартам.


Полный текст Frontier Governance Framework доступен на официальном сайте OpenAI.