Двухступенчатая надежная водяная марка для изображений

С развитием генеративного ИИ, особенно в области создания изображений, возникает необходимость в эффективных методах защиты авторских прав и предотвращения распространения дезинформации. Одним из таких методов является водяная маркировка изображений, которая позволяет владельцам моделей идентифицировать и помечать свои сгенерированные контенты. Однако, существующие методы водяной маркировки часто уязвимы к атакам, направленным на удаление или подделку водяных знаков. В данной статье мы рассмотрим новый подход к водяной маркировке изображений, предложенный в работе "Hidden in the Noise: Two-Stage Robust Watermarking for Images".

Проблема и ее значение

Генеративные модели, такие как диффузионные модели, способны создавать высококачественные изображения, которые могут быть неотличимы от реальных. Однако, это также открывает возможности для создания "глубоких фальшивок" (deepfakes), что вызывает серьезные опасения в обществе. Водяная маркировка изображений может помочь в решении этой проблемы, позволяя идентифицировать и отслеживать сгенерированные изображения.

Существующие методы водяной маркировки, такие как Tree-Ring и RingID, имеют свои ограничения. Они могут быть уязвимы к атакам, основанным на изменении распределения сгенерированных изображений, что делает их менее надежными. В этом контексте, необходимо разработать новые подходы к водяной маркировке, которые будут более устойчивыми к атакам.

Основные концепции водяной маркировки

Устойчивость к атакам

Водяная маркировка должна быть устойчивой к различным видам атак, включая:

Удаление водяного знака: попытка удалить водяной знак из изображения без заметного ухудшения качества.
Подделка водяного знака: создание нового изображения с использованием существующего водяного знака.

Для достижения устойчивости к таким атакам, необходимо использовать методы, которые не искажают распределение сгенерированных изображений. В этом контексте, начальный шум, используемый в диффузионных моделях, может служить основой для создания водяного знака.

Начальный шум как водяная марка

Одним из ключевых аспектов работы является использование начального шума в качестве водяного знака. Исследования показывают, что начальный шум, который используется в процессе генерации изображений, может быть преобразован в водяной знак, который не искажает распределение изображений. Это достигается за счет использования псевдослучайных паттернов шума, которые можно легко восстанавливать.

Двухступенчатая система водяной маркировки

Предложенная методология, называемая WIND (Watermarking with Indistinguishable and Robust Noise for Diffusion Models), состоит из двух этапов: генерации и обнаружения.

Этап генерации

На этапе генерации происходит следующее:

Выбор начального шума: выбирается индекс начального шума из заданного диапазона.
Создание идентификатора группы: на основе выбранного индекса создается идентификатор группы, который будет использоваться для упрощения поиска.
Встраивание идентификатора: идентификатор встраивается в пространство Фурье начального шума.
Генерация изображения: с использованием модифицированного начального шума создается сгенерированное изображение.

Этап обнаружения

На этапе обнаружения осуществляется:

Восстановление начального шума: из сгенерированного изображения восстанавливается начальный шум.
Извлечение идентификатора группы: из восстановленного шума извлекается идентификатор группы.
Поиск совпадений: производится поиск среди начальных шумов, соответствующих идентификатору группы, для нахождения наиболее похожего шума.

Устойчивость к подделке и удалению

Метод WIND демонстрирует значительное улучшение устойчивости к атакам по сравнению с предыдущими методами. Даже если злоумышленник получит доступ к одному из водяных знаков, остальные останутся защищенными благодаря использованию криптографической хеш-функции и секретного соли.

Эмпирическая проверка

Для проверки устойчивости метода WIND проводились эксперименты с различными атаками, включая:

Атаки на удаление: проверка способности метода сохранять водяной знак после попыток его удаления.
Атаки на подделку: оценка возможности злоумышленника создать фальшивое изображение с использованием восстановленного шума.

Результаты показали, что метод WIND сохраняет высокую степень устойчивости даже при наличии атак.

Применение к негенерированным изображениям

Метод WIND также можно адаптировать для применения к негенерированным изображениям. Используя технику инпейнтинга, водяной знак может быть внедрен в естественное изображение с минимальным визуальным воздействием. Это позволяет защитить авторские права на изображения, которые были изменены или модифицированы.

Заключение

Работа "Hidden in the Noise: Two-Stage Robust Watermarking for Images" предлагает новый подход к водяной маркировке изображений, который сочетает в себе эффективность и устойчивость к атакам. Использование начального шума в качестве водяного знака, а также двухступенчатая система обнаружения делают этот метод особенно привлекательным для защиты авторских прав в эпоху генеративного ИИ. В будущем, дальнейшие исследования могут сосредоточиться на улучшении алгоритмов и расширении их применения к различным типам изображений.

Статья на arxiv Оригинал pdf distortion detection augmentation

Ай Дайджест