Свежая выжимка ml и AI статей - каждый день
В современной эре цифровых технологий, создание высококачественных 3D моделей является ключевым элементом для множества приложений, от виртуальной реальности до кино и видеоигр. Введение модели DreamPolish представляет собой значительный шаг вперед в области генерации 3D контента, предлагая методы для создания моделей с утонченной геометрией и фотореалистичными текстурами.
Генерация 3D активов имеет решающее значение для многих отраслей, включая VR, кино, видеоигры и 3D печать. Существующие методы генерации 3D можно разделить на две основные категории: нативные 3D методы и гибридные 2D/3D методы. Нативные методы напрямую моделируют 3D данные, демонстрируя успехи в создании базовых 3D объектов, но они часто сталкиваются с трудностями при генерации сложных объектов с детальной геометрией и фотореалистичными текстурами из-за недостатка качественных данных для обучения.
С другой стороны, гибридные методы, объединяющие 2D диффузионные модели с 3D нейронными представлениями, показали многообещающие результаты. В частности, метод Score Distillation Sampling (SDS), введенный в DreamFusion, стал широко используемым в гибридных моделях для переноса способностей фотореалистичной генерации из 2D моделей в 3D контент.
DreamPolish разделяет процесс генерации 3D на две фазы: прогрессивную полировку геометрии и генерацию текстур, руководствуясь доменом.
В этой фазе DreamPolish использует несколько нейронных представлений для улучшения стабильности синтеза геометрии. Вместо того, чтобы полагаться только на предварительно обученные диффузионные модели, которые могут привести к нежелательным артефактам на поверхности, DreamPolish добавляет этап полировки поверхности. Этот этап использует нормальный эстиматор для уточнения геометрических деталей, что позволяет создать объекты с более желательной геометрией.
NeRF: Начальный этап, где используется Neural Radiance Fields для быстрого создания базовой структуры.
NeuS: Переход к более точному представлению поверхности, которое обеспечивает детальную информацию о поверхности.
DMTet: Использование деформируемой тетраэдрической сетки для оптимизации геометрии и топологии, что позволяет создавать высококачественные 3D модели.
На этом этапе фиксируются параметры текстуры, и только геометрия обновляется для уточнения поверхности. Используется предварительно обученная модель для предсказания нормальных карт с новых точек зрения, что помогает устранить неоднозначности в геометрии.
Вторая фаза фокусируется на создании текстур, которые должны быть не только фотореалистичными, но и стабильными. DreamPolish вводит новый объектив дистилляции оценок, названный Domain Score Distillation (DSD), который направляет нейронные представления к домену, содержащему фотореалистичные и последовательные изображения.
DSD объединяет в себе два направления руководства: одно от вариационного домена, которое обеспечивает фотореалистичность, и другое от безусловного домена изображений, который гарантирует стабильность процесса дистилляции. Это позволяет балансировать качество и стабильность генерации текстур.
Эксперименты показали, что DreamPolish превосходит существующие методы по качеству генерируемых 3D активов. Были проведены сравнения с моделями DreamFusion, GeoDream, ProlificDreamer, Magic123 и DreamCraft3D. DreamPolish демонстрирует лучшие результаты по метрикам PSNR, SSIM, LPIPS и CLIP Score, подтверждая свою способность создавать модели с высококачественной геометрией и фотореалистичными текстурами.
DreamPolish представляет собой значительный прогресс в области генерации 3D контента, предлагая новаторские методы для создания моделей с утонченной геометрией и фотореалистичными текстурами. Хотя модель имеет свои ограничения, связанные с начальным качеством геометрии и вычислительными затратами, она устанавливает новый стандарт в области 3D генерации, открывая путь для дальнейших исследований и улучшений.