OpenAI внедряет SynthID: невидимые водяные знаки для ИИ-изображений
OpenAI внедрила невидимые водяные знаки SynthID от Google DeepMind и запустила публичный инструмент верификации ИИ-контента. Разбираем, как это работает.
Когда конкуренты строят вместе: историческое партнёрство
Представьте: вы видите в социальных сетях шокирующее фото — катастрофа, политик в скандальной ситуации, фейковое событие. Как понять, реальное это или сгенерировано нейросетью за пять секунд? Именно этот вопрос — один из главных вызовов цифровой эпохи — подтолкнул двух технологических гигантов к неожиданному альянсу.
OpenAI наложила технологию водяных знаков SynthID от Google DeepMind поверх своих существующих учётных данных контента C2PA, создав двухуровневую систему, призванную сделать ИИ-контент идентифицируемым даже тогда, когда кто-то активно пытается удалить эту информацию.
Это не просто техническое обновление. Google разработала SynthID и теперь видит, как её принимает крупнейший конкурент в ИИ — это нетипичная динамика, больше напоминающая принятие открытых стандартов, чем обычную технологическую конкуренцию, что говорит о том, что отрасль движется к общим инструментам верификации провенанса, а не к несовместимым разрозненным системам.
Что такое SynthID и как работает невидимый водяной знак
SynthID встраивает незаметные маркеры непосредственно в ИИ-генерируемый контент в момент его создания, что позволяет впоследствии верифицировать происхождение контента.
Ключевое слово здесь — «незаметные». В отличие от видимых плашек «Сгенерировано ИИ», SynthID работает на уровне пикселей.
Подход SynthID принципиально отличается от традиционных водяных знаков тем, что интегрирует маркеры идентификации на уровне генерации, а не в виде удаляемых метаданных, создавая существенно более защищённую от взлома систему при сохранении качества и верности контента.
Как SynthID работает для разных типов контента
SynthID использует разные механизмы в зависимости от носителя. Принцип последователен, но инжиниринг — кастомный.
Изображения: Поскольку водяной знак распределён по всему изображению на уровне пикселей, он невероятно устойчив. Можно обрезать изображение, повернуть его, сжать до мутного JPEG или применить высококонтрастный фильтр — детектор, как правило, всё равно найдёт сигнал.
Видео: Разработанная техника встраивает водяной знак непосредственно в пиксели каждого видеокадра, делая его незаметным для человеческого глаза, но поддающимся обнаружению.
Текст: Для текста SynthID использует процессор логитов, который тонко перемешивает вероятности токенов во время генерации, кодируя обнаруживаемый водяной знак без необходимости переобучения модели.
Аудио: Для аудио, генерируемого такими инструментами, как Lyria от Google, SynthID работает в спектрограмме — визуальном представлении частотного спектра. Он встраивает водяной знак в частотный домен аудиодорожки.
Зачем OpenAI понадобился SynthID поверх C2PA
До этого партнёрства OpenAI уже использовала стандарт C2PA. OpenAI занималась разработкой и принятием стандартов провенанса с 2024 года, начав добавлять Content Credentials к изображениям, генерируемым DALL·E 3, а затем распространив практику на ImageGen и Sora.
Но у метаданных есть критическая уязвимость. Метаданные не являются защищёнными от взлома. Их можно удалить, они теряются при загрузках и скачиваниях или разрушаются при преобразованиях — изменении формата файла, масштабировании или создании скриншотов.
Instagram, X (Twitter) и WhatsApp удаляют метаданные C2PA при загрузке изображения. Учётные данные, доказывающие, что изображение сгенерировано ИИ, существуют при создании, при скачивании — и исчезают в тот момент, когда попадают на платформу, которой пользуются миллиарды людей.
Именно здесь SynthID восполняет критический пробел:
Эти две системы усиливают друг друга. C2PA помогает контенту нести детальный контекст; SynthID помогает сохранить сигнал, когда метаданные не выживают. Водяные знаки более устойчивы к преобразованиям, таким как скриншоты, тогда как метаданные могут предоставить больше информации, чем один водяной знак. Вместе они делают провенанс более устойчивым, чем каждый уровень в отдельности.
«Эти две системы усиливают друг друга. C2PA помогает контенту нести детальный контекст; SynthID помогает сохранить сигнал, когда метаданные не выживают» — OpenAI
flowchart TD
A[ИИ генерирует изображение] --> B[Встраивается C2PA метаданные]
A --> C[Встраивается SynthID водяной знак в пиксели]
B --> D{Загрузка в соцсети}
C --> D
D --> E[C2PA метаданные могут быть удалены]
D --> F[SynthID в пикселях сохраняется]
E --> G[Верификационный инструмент OpenAI]
F --> G
G --> H[Результат: Создано ИИ / Не определено]
Публичный инструмент верификации: как им пользоваться
OpenAI представила предварительный просмотр публичного инструмента верификации, который поможет людям проверить, было ли загруженное изображение сгенерировано в ChatGPT, OpenAI API или Codex, путём проверки наличия сигналов провенанса, включая Content Credentials и SynthID.
Инструмент проверяет как водяные знаки, так и метаданные, чтобы определить, было ли содержимое создано OpenAI.
На момент запуска инструмент верификации ограничен контентом, созданным OpenAI. Компания заявила, что планирует поддержать межотраслевые усилия по верификации на различных платформах в ближайшие месяцы и ожидает добавить поддержку дополнительных типов контента со временем.
Сравнение C2PA и SynthID
| Характеристика | C2PA метаданные | SynthID водяной знак |
|---|---|---|
| Где хранится | В метаданных файла | В пикселях изображения |
| Выживает после скриншота | ❌ Нет | ✅ Да |
| Выживает после сжатия | ⚠️ Частично | ✅ Да |
| Выживает после загрузки в соцсети | ❌ Часто удаляется | ✅ Сохраняется |
| Содержит детали о происхождении | ✅ Подробно | ⚠️ Только сигнал |
| Тип проверки | Криптографическая подпись | Вероятностная (3 уровня) |
| Устойчивость к злоумышленникам | ⚠️ Средняя | ⚠️ Средняя |
Ограничения системы и честность о её пределах
Оба компании — OpenAI и Google DeepMind — открыто говорят об ограничениях.
Ни OpenAI, ни Google DeepMind не утверждают, что эта система является надёжной. Заявленная цель — «повысить стоимость злоупотреблений, а не победить решительных злоумышленников», обеспечив масштабируемый уровень атрибуции, который усложняет случайный обман, не претендуя на то, чтобы остановить сложных злоумышленников.
Также стоит учитывать технические ограничения SynthID:
- Тяжёлые преобразования (экстремальное сжатие, агрессивная фильтрация, конвейеры image-to-image) могут ослабить или стереть сигнал.
- Применение водяного знака менее эффективно для фактических ответов, поскольку там меньше возможностей для дополнения генерации без снижения точности. Оценки уверенности детектора могут резко снижаться, когда ИИ-генерированный текст тщательно перефразируется или переводится на другой язык.
- Новые средства защиты распространяются только на изображения, созданные продуктами OpenAI, поэтому они не повлияют на поток изображений из менее авторитетных ИИ-инструментов.
Регуляторный контекст: зачем это нужно прямо сейчас
За этим шагом стоит не только этическая позиция, но и реальное регуляторное давление.
Статья 50 Закона ЕС об ИИ, которая вступает в полную силу 2 августа 2026 года, устанавливает обязательства по прозрачности, которые фактически предписывают машиночитаемую маркировку для ИИ-генерируемого контента. Провайдеры систем генеративного ИИ должны маркировать выходные данные в форматах, доступных как для людей, так и для машин.
Регуляция предписывает многоуровневый подход: встраивание метаданных, невидимые водяные знаки и логирование — C2PA покрывает уровень встраивания метаданных, SynthID и аналогичные инструменты покрывают уровень водяных знаков.
Инциденты с дипфейками, отслеживаемые по всему миру, выросли приблизительно с 500 000 случаев в 2023 году до более 8 миллионов в 2025-м — рост на 900% за два года, по данным исследователей в области безопасности идентификации. На этом фоне инициатива OpenAI выглядит не как PR-ход, а как вынужденная необходимость.
Отраслевой сигнал: рождение открытого стандарта
SynthID-Image использовался для нанесения водяных знаков на более чем десять миллиардов изображений и видеокадров в сервисах Google. Теперь эта технология будет работать и внутри экосистемы OpenAI.
OpenAI заявила, что стала соответствующим производителем продукта для Coalition for Content Provenance and Authenticity (C2PA), предоставив платформам метод считывания и сохранения информации, прикреплённой к контенту, созданному системами OpenAI.
SynthID эффективно работает самостоятельно, но также может сочетаться с другими подходами к обнаружению ИИ, обеспечивая лучшее покрытие различных типов контента и платформ.
Отраслевая картина поддержки C2PA на сегодня:
| Компания / Продукт | C2PA | SynthID | Статус |
|---|---|---|---|
| OpenAI DALL·E 3 / ChatGPT | ✅ | ✅ (новое) | Активно |
| Google Imagen / Gemini | ✅ | ✅ | Активно |
| Adobe Firefly | ✅ | ❌ | Активно |
| Microsoft Bing Image Creator | ✅ | ❌ | Активно |
| Midjourney | ✅ (2026) | ❌ | Активно |
| Stability AI | ⚠️ Частично | ❌ | Ограниченно |
Заключение: шаг в правильном направлении
Внедрение SynthID компанией OpenAI — это важный прецедент. Впервые два крупнейших игрока рынка ИИ договорились об общем техническом стандарте верификации контента, поставив интересы экосистемы выше конкурентных амбиций.
Двухуровневая система C2PA + SynthID не является серебряной пулей. Эта техника не создана для прямого противодействия мотивированным злоумышленникам, но может усложнить использование ИИ-генерируемого контента в злонамеренных целях. Тем не менее это честная, масштабируемая и технически обоснованная защита.
Что это означает для обычных пользователей:
- Создавайте контент через ChatGPT, DALL·E или Codex — он автоматически получит двойную маркировку
- Используйте новый публичный инструмент верификации OpenAI для проверки подозрительных изображений
- Помните: отсутствие водяного знака ≠ подлинность. Это означает лишь, что инструмент генерации не поддерживает SynthID
Опираясь на давнюю поддержку Content Credentials, достигнув соответствия с C2PA, приняв SynthID и предложив публичный инструмент верификации, OpenAI надеется внести долгосрочный вклад в создание более интероперабельной экосистемы провенанса.
Провенанс контента перестаёт быть академической темой — он становится инфраструктурой доверия в эпоху, когда отличить реальное от сгенерированного всё сложнее.