Свежая выжимка ml и AI статей - каждый день
В последние годы искусственный интеллект (AI) и, в частности, модели генерации изображений, такие как LLM, стали важными инструментами в области искусства. Они способны создавать визуальные произведения, которые могут соперничать с работами человеческих художников. Однако возникает вопрос: насколько необходимо предварительное знание о искусстве для создания художественных произведений? В данной статье мы исследуем этот вопрос, основываясь на работе, которая представляет новый подход к генерации изображений без доступа к традиционным художественным данным.
Мы предлагаем модель генерации изображений, которая обучается на данных, не содержащих графического искусства. Наша цель — выяснить, можно ли создать художественные произведения, используя лишь несколько примеров определённого художественного стиля. Мы используем метод, известный как Art Adapter, который позволяет модели адаптироваться к выбранному стилю, даже если она изначально не имела доступа к художественным изображениям.
Модели генерации изображений, такие как диффузионные модели, привлекли значительное внимание благодаря своей способности создавать высококачественные изображения на основе текстовых подсказок. Эти модели, как правило, требуют обширных наборов данных, содержащих большое количество художественных изображений, чтобы успешно воспроизводить стили различных художников. Однако это также вызывает этические вопросы, связанные с авторскими правами и возможностью подделки работ.
Существующие модели часто сталкиваются с обвинениями в том, что они копируют стили известных художников без разрешения. Это привело к ряду судебных разбирательств и обсуждений о том, как обеспечить этическую целесообразность AI в искусстве. В ответ на эти проблемы некоторые исследователи начали разрабатывать методы, позволяющие исключить определённые концепции из обучающих наборов данных, однако эти методы часто оказываются неэффективными.
Для решения вышеуказанных проблем мы разработали модель, которую назвали Art-Free Diffusion. Эта модель обучается на "арт-агностическом" наборе данных, который исключает любые графические элементы. Мы используем набор данных SAM-LLava-Captions10M, который в основном содержит изображения природных сцен, чтобы избежать влияния художественного контента.
Для адаптации модели к конкретным художественным стилям мы используем Art Adapter — метод, позволяющий вводить художественные знания в модель, не имеющую предварительных знаний о графическом искусстве. Мы обучаем Art Adapter на небольшом количестве примеров художественных работ, что позволяет модели успешно воспроизводить стили, даже если она изначально была "арт-свободной".
Мы провели ряд экспериментов, чтобы оценить, насколько успешно наша модель может имитировать художественные стили. Мы использовали методы оценки, такие как сравнение с реальными произведениями искусства, краудсорсинговые оценки художественной эффективности и анализ атрибуции данных.
Наши результаты показывают, что изображения, созданные с помощью Art-Free Diffusion, воспринимаются пользователями как сопоставимые с произведениями, созданными моделями, обученными на больших наборах данных, содержащих художественные элементы. Это подтверждает, что модель может успешно адаптироваться к различным стилям, даже с минимальным предварительным обучением.
Интересно, что при анализе данных мы обнаружили, что изображения из набора данных SAM значительно способствуют процессу генерации художественных образов. Это подчеркивает, как реальный мир может вдохновлять художественное выражение. Даже абстрактные имитации искусства имели сильные связи с природными изображениями, что говорит о том, что искусство может возникать из непосредственного взаимодействия с окружающим миром.
Мы провели интервью с профессиональным художником, чтобы получить экспертное мнение о том, насколько хорошо наша модель может имитировать его стиль. Художник отметил, что AI действительно смог захватить некоторые аспекты его уникального стиля, хотя и с определенными ограничениями. Это подчеркивает потенциал AI в искусстве, но также и необходимость внимательного подхода к его использованию.
В данной работе мы представили новый подход к генерации художественных изображений, который не требует предварительных знаний о графическом искусстве. Наша модель, Art-Free Diffusion, с помощью Art Adapter может успешно адаптироваться к различным художественным стилям, используя лишь несколько примеров. Это открывает новые горизонты для исследований в области AI и искусства, а также поднимает важные вопросы о природе художественного выражения и его связи с окружающим миром.