Кто создал это изображение — человек или ИИ?

Каждый день миллионы людей сталкиваются с фотографиями, видео и аудио, созданными искусственным интеллектом. Отличить их от «настоящих» становится всё сложнее. OpenAI делает важный шаг навстречу прозрачности: компания объявила о многоуровневом подходе к установлению происхождения (provenance — происхождение, история создания) контента, включающем Content Credentials (удостоверения контента), SynthID (невидимые водяные знаки) и публичный инструмент верификации.

Люди ежедневно используют инструменты OpenAI для создания и редактирования изображений и аудио — и по мере того, как эти инструменты становятся частью повседневной жизни, крайне важно, чтобы пользователи могли понимать и проверять происхождение медиафайлов.

Прозрачность в мире ИИ — это не просто техническая функция, это фундамент доверия между людьми и технологиями.


Что такое Content Provenance (происхождение контента)?

Сигналы происхождения (provenance signals) дают людям контекст о том, откуда взялся контент, как он был создан или отредактирован, и является ли он тем, чем кажется.

Проще говоря, это своеобразный «паспорт» медиафайла. Представьте, что каждое изображение или видео несёт с собой историю: кто его создал, каким инструментом, когда и какие правки вносились. Именно это и обеспечивают современные стандарты провенанса.

Content Credentials принято сравнивать с этикеткой пищевой ценности, только для цифровых медиа. По аналогии с составом продукта на упаковке, вы можете «прочитать» историю любого изображения.

ℹ Что такое C2PA?
C2PA (Coalition for Content Provenance and Authenticity — Коалиция за провенанс и подлинность контента) — это открытый технический стандарт. C2PA добавляет криптографически подписанные метаданные к медиафайлам, позволяя верифицировать происхождение контента и историю его редактирования. В коалицию входят Adobe, Microsoft, BBC, Google, Meta, OpenAI, Sony и сотни других компаний.

Два слоя защиты: C2PA + SynthID

OpenAI укрепляет свой подход к провенансу контента с помощью многоуровневой, экосистемно-ориентированной модели построения доверия в интернете. Эта модель строится на двух взаимодополняющих технологиях.

Слой 1: Content Credentials (метаданные C2PA)

Ключевая структура данных C2PA — манифест (Content Credential) — фиксирует, кто создал контент, когда, какие инструменты использовались, участвовал ли ИИ, и каждое значимое редактирование с момента создания.

В отличие от обычных метаданных, Content Credentials криптографически подписаны, что делает их защищёнными от подделки. Любая попытка вмешательства нарушает подпись и немедленно обнаруживается.

OpenAI добавляет Content Credentials к изображениям, созданным DALL·E 3, начиная с 2024 года, позже распространив эту практику на ImageGen и Sora.

Слой 2: SynthID (невидимые водяные знаки)

OpenAI интегрирует технологию водяных знаков SynthID от Google DeepMind для изображений, созданных через ChatGPT, Codex или OpenAI API.

SynthID встраивает незаметный сигнал непосредственно в содержимое файла — такой сигнал сохраняется даже после обрезки, сжатия, создания скриншотов и других типичных манипуляций при распространении в интернете.

Почему это важно? Метаданные — хрупкая вещь: загрузите изображение на большинство социальных платформ, и данные о происхождении будут удалены, как будто их никогда не было. SynthID решает эту проблему.

💡 Как работают два слоя вместе?
Если у контента есть C2PA-учётные данные, верификатор получает полную историю происхождения. Если учётные данные удалены, но водяной знак обнаружен — верификатор всё равно знает, что контент создан ИИ, даже без подробной цепочки.

Как взаимодействуют C2PA и SynthID


graph TD
    A[ИИ генерирует изображение] --> B[Добавляются Content Credentials / C2PA]
    A --> C[Встраивается водяной знак SynthID]
    B --> D{Публикация в интернете}
    C --> D
    D --> E[Метаданные C2PA сохранены]
    D --> F[Метаданные удалены платформой]
    E --> G[Полная история происхождения]
    F --> H[SynthID-водяной знак выжил]
    H --> I[Контент идентифицирован как ИИ]
    G --> J[Верификация через публичный инструмент OpenAI]
    I --> J

C2PA помогает контенту нести подробный контекст; SynthID сохраняет сигнал, когда метаданные не выживают. Водяные знаки более устойчивы к трансформациям вроде скриншотов, тогда как метаданные содержат больше информации, чем водяной знак в одиночку. Вместе они делают провенанс более надёжным, чем каждый из слоёв по отдельности.


Публичный инструмент верификации

OpenAI предлагает предварительную версию публичного инструмента верификации, который позволяет пользователям проверить, было ли загружаемое изображение создано с помощью ChatGPT, OpenAI API или Codex, обнаруживая сигналы происхождения, включая Content Credentials и SynthID.

Инструмент проверяет как водяные знаки, так и метаданные, чтобы определить, происходит ли контент от OpenAI.

📝 Практический пример
Представьте, что вы видите в Telegram якобы «настоящую» фотографию известного политика в неоднозначной ситуации. С помощью публичного инструмента OpenAI вы можете загрузить это изображение и за секунды узнать: было ли оно сгенерировано ChatGPT или другими инструментами OpenAI. Если водяной знак SynthID обнаружен — изображение помечается как ИИ-контент, даже если метаданные были удалены.

Сравнение технологий провенанса

ХарактеристикаContent Credentials (C2PA)SynthID (водяной знак)
Тип защитыКриптографически подписанные метаданныеНевидимый цифровой водяной знак
Устойчивость к удалениюНизкая (легко удаляется)Высокая (выживает при скриншотах и сжатии)
Объём информацииПолная история редактированияТолько факт создания ИИ
Открытый стандартДа (C2PA — открытый стандарт)Нет (технология Google DeepMind)
Требует поддержки платформойДаНет
Основные сторонникиAdobe, Microsoft, BBC, OpenAI, Google, MetaGoogle DeepMind, OpenAI

Отраслевое сотрудничество: конкуренты объединяются ради доверия

Одна из самых интересных сторон этой истории — масштаб кооперации между компаниями, которые в других сферах конкурируют друг с другом.

Google разработала SynthID — и теперь видит, как её главный конкурент в сфере ИИ принимает эту технологию. Это необычная динамика, больше напоминающая принятие открытых стандартов, чем типичную технологическую конкуренцию, — что говорит о консолидации отрасли вокруг общих инструментов провенанса, а не фрагментации на несовместимые системы.

OpenAI вступила в Руководящий комитет C2PA — межотраслевую группу, стоящую за открытым техническим стандартом провенанса контента.

Сегодня в коалиции участвуют сотни компаний, возглавляемых Microsoft, Adobe, Intel, BBC, Truepic, Sony, Publicis Groupe, OpenAI, Google, Meta и Amazon.

⚠ Не панацея

Ни OpenAI, ни Google DeepMind не утверждают, что эта система безупречна. Заявленная цель — «повысить стоимость злоупотреблений, а не победить решительных злоумышленников»: обеспечить масштабируемый слой атрибуции, который усложнит случайный обман, не претендуя на остановку изощрённых атак.

Открытые модели с открытым исходным кодом (Stable Diffusion, Llama и другие) остаются сложной проблемой: открытые весовые модели нельзя обязать использовать водяные знаки, поскольку каждый может скомпилировать их без этой функции.


Почему это важно для России и СНГ?

В русскоязычном информационном пространстве дипфейки и ИИ-дезинформация давно стали реальной проблемой. Ложные изображения распространяются в Telegram-каналах, ВКонтакте и новостных агрегаторах с огромной скоростью. Стандарты провенанса могут стать важным инструментом медиаграмотности для журналистов, fact-checkers и обычных пользователей.

Если ведущие платформы и мессенджеры примут поддержку C2PA и SynthID, любой пользователь сможет в один клик узнать правду о происхождении вирусного контента.


Что дальше?

Публичный портал SynthID от Google, поддержка Content Credentials OpenAI для DALL·E 3 и пилотные программы от Meta, TikTok и LinkedIn указывают на широкое движение отрасли к маркировке и документированию синтетического контента.

Экосистема провенанса продолжает расти: по данным Adobe’s Content Authenticity Initiative, по состоянию на октябрь 2024 года более 500 миллионов единиц контента было опубликовано с Content Credentials.

Будущее за комплексным подходом: метаданные + водяные знаки + образование пользователей + платформенная политика. OpenAI делает важный шаг в правильном направлении, а сотрудничество с Google DeepMind и участие в C2PA говорит о том, что отрасль наконец-то начинает относиться к проблеме доверия к контенту серьёзно.

Технологии создания ИИ-контента развиваются стремительно. Инструменты его верификации должны развиваться не менее быстро.