Ай Дайджест

Свежая выжимка ml и AI статей - каждый день

DreamPolish: Инновационный подход к созданию 3D моделей

В современной эре цифровых технологий, создание высококачественных 3D моделей является ключевым элементом для множества приложений, от виртуальной реальности до кино и видеоигр. Введение модели DreamPolish представляет собой значительный шаг вперед в области генерации 3D контента, предлагая методы для создания моделей с утонченной геометрией и фотореалистичными текстурами.

Генерация 3D активов имеет решающее значение для многих отраслей, включая VR, кино, видеоигры и 3D печать. Существующие методы генерации 3D можно разделить на две основные категории: нативные 3D методы и гибридные 2D/3D методы. Нативные методы напрямую моделируют 3D данные, демонстрируя успехи в создании базовых 3D объектов, но они часто сталкиваются с трудностями при генерации сложных объектов с детальной геометрией и фотореалистичными текстурами из-за недостатка качественных данных для обучения.

С другой стороны, гибридные методы, объединяющие 2D диффузионные модели с 3D нейронными представлениями, показали многообещающие результаты. В частности, метод Score Distillation Sampling (SDS), введенный в DreamFusion, стал широко используемым в гибридных моделях для переноса способностей фотореалистичной генерации из 2D моделей в 3D контент.

DreamPolish: Основные концепции

DreamPolish разделяет процесс генерации 3D на две фазы: прогрессивную полировку геометрии и генерацию текстур, руководствуясь доменом.

Прогрессивная полировка геометрии

В этой фазе DreamPolish использует несколько нейронных представлений для улучшения стабильности синтеза геометрии. Вместо того, чтобы полагаться только на предварительно обученные диффузионные модели, которые могут привести к нежелательным артефактам на поверхности, DreamPolish добавляет этап полировки поверхности. Этот этап использует нормальный эстиматор для уточнения геометрических деталей, что позволяет создать объекты с более желательной геометрией.

Этапы прогрессивной конструкции:

  1. NeRF: Начальный этап, где используется Neural Radiance Fields для быстрого создания базовой структуры.

  2. NeuS: Переход к более точному представлению поверхности, которое обеспечивает детальную информацию о поверхности.

  3. DMTet: Использование деформируемой тетраэдрической сетки для оптимизации геометрии и топологии, что позволяет создавать высококачественные 3D модели.

Полировка поверхности:

На этом этапе фиксируются параметры текстуры, и только геометрия обновляется для уточнения поверхности. Используется предварительно обученная модель для предсказания нормальных карт с новых точек зрения, что помогает устранить неоднозначности в геометрии.

Генерация текстур, руководствуясь доменом

Вторая фаза фокусируется на создании текстур, которые должны быть не только фотореалистичными, но и стабильными. DreamPolish вводит новый объектив дистилляции оценок, названный Domain Score Distillation (DSD), который направляет нейронные представления к домену, содержащему фотореалистичные и последовательные изображения.

DSD объектив:

DSD объединяет в себе два направления руководства: одно от вариационного домена, которое обеспечивает фотореалистичность, и другое от безусловного домена изображений, который гарантирует стабильность процесса дистилляции. Это позволяет балансировать качество и стабильность генерации текстур.

Эксперименты и результаты

Эксперименты показали, что DreamPolish превосходит существующие методы по качеству генерируемых 3D активов. Были проведены сравнения с моделями DreamFusion, GeoDream, ProlificDreamer, Magic123 и DreamCraft3D. DreamPolish демонстрирует лучшие результаты по метрикам PSNR, SSIM, LPIPS и CLIP Score, подтверждая свою способность создавать модели с высококачественной геометрией и фотореалистичными текстурами.

Заключение

DreamPolish представляет собой значительный прогресс в области генерации 3D контента, предлагая новаторские методы для создания моделей с утонченной геометрией и фотореалистичными текстурами. Хотя модель имеет свои ограничения, связанные с начальным качеством геометрии и вычислительными затратами, она устанавливает новый стандарт в области 3D генерации, открывая путь для дальнейших исследований и улучшений.