Свежая выжимка ml и AI статей - каждый день
Синтез новизны (Novel View Synthesis, NVS) является одной из ключевых задач в области компьютерного зрения и графики. Он позволяет генерировать изображения из различных точек зрения на основе имеющихся 2D-изображений. В последние годы технологии, такие как NeRF (Neural Radiance Fields), значительно продвинули эту область, но они требуют больших вычислительных ресурсов и времени на обучение. В ответ на эти вызовы была разработана новая методология - SplineGS, которая представляет собой динамическую 3D-гауссову сплошность (3D Gaussian Splatting) с использованием адаптивных сплайнов.
3DGS - это метод, основанный на представлении поля радиации сцены с помощью анизотропных 3D-гауссовых функций. Каждая такая функция описывается с помощью параметров, таких как среднее значение и ковариационная матрица. Это позволяет эффективно моделировать сложные геометрические структуры с минимальными затратами вычислительных ресурсов.
В SplineGS ключевым элементом является метод Motion-Adaptive Spline (MAS), который использует кубические сплайны Гермита для представления непрерывных динамических 3D-гауссовых траекторий. Сплайны позволяют эффективно моделировать сложные движения с минимальным количеством управляющих точек. Это делает их идеальными для динамических сцен, где объекты могут изменять форму и положение.
В рамках MAS была внедрена методика Motion-Adaptive Control Points Pruning (MACP), которая позволяет адаптивно изменять количество контрольных точек в зависимости от сложности движения. Это помогает избежать переобучения и улучшает качество рендеринга, сохраняя при этом высокую скорость обработки.
Одной из уникальных особенностей SplineGS является возможность совместной оптимизации параметров камеры и атрибутов 3D-гауссов. Это достигается за счет использования фотометрической и геометрической согласованности, что исключает необходимость в предварительном вычислении параметров камеры, как это делается в традиционных подходах.
Высокое качество рендеринга: SplineGS демонстрирует значительное улучшение качества по сравнению с существующими методами, достигая более высоких значений PSNR и меньших значений LPIPS.
Скорость рендеринга: Метод обеспечивает скорость рендеринга, в тысячи раз превышающую таковую у других современных технологий, таких как RoDynRF и DynNeRF.
Устойчивость к реальным условиям: Благодаря совместной оптимизации и адаптивному подходу, SplineGS показывает высокую устойчивость к шумам и артефактам, возникающим в реальных видеозаписях.
Новые достижения в области динамического NVS включают в себя различные методы, такие как динамические NeRF и расширенные 3DGS. Однако многие из этих методов сталкиваются с проблемами, связанными с вычислительной сложностью и качеством рендеринга. SplineGS, с другой стороны, предлагает более эффективное решение без необходимости в предварительной обработке данных.
Архитектура SplineGS включает несколько этапов, начиная с обработки входного монокулярного видео и заканчивая синтезом новизны. Основные компоненты включают:
Оптимизация параметров камеры: На первом этапе осуществляется грубая оптимизация параметров камеры с использованием фотометрической и геометрической согласованности.
Инициализация 3D-гауссовых функций: На основании оцененных параметров камеры и контрольных точек, инициализируются 3D-гауссовые функции.
Совместная оптимизация: На этом этапе происходит совместная оптимизация атрибутов 3D-гауссов и параметров камеры.
Процесс инициализации контрольных точек важен для обеспечения стабильной оптимизации. Для этого используются методы, такие как 2D-трекинг и метрика глубины, что позволяет точно установить начальные значения для контрольных точек.
MACP позволяет динамически изменять количество контрольных точек в зависимости от сложности движения объектов. Это достигается путем вычисления ошибки между текущими и новыми контрольными точками и обновления их по мере необходимости.
В рамках экспериментов SplineGS была протестирована на различных датасетах, включая NVIDIA и DAVIS. Результаты показали, что SplineGS значительно превосходит существующие методы по качеству рендеринга и скорости.
Результаты количественного анализа показали, что SplineGS достигает более высоких значений PSNR и более низких значений LPIPS по сравнению с другими методами, такими как COLMAP, DynNeRF и RoDynRF. Это подтверждает эффективность и преимущества SplineGS в контексте динамических сцен.
Визуальные сравнения также показали, что SplineGS обеспечивает более высокое качество изображений, особенно в сложных динамических сценах, где другие методы не справляются с задачей.
SplineGS представляет собой значительный шаг вперед в области синтеза новизны из монокулярных видео. Используя адаптивные сплайны и эффективные методы оптимизации, SplineGS обеспечивает высокое качество рендеринга и скорость, что делает его идеальным инструментом для применения в виртуальной и дополненной реальности, а также в производстве фильмов. Дальнейшие исследования могут сосредоточиться на интеграции методов устранения размытия для улучшения качества входных данных и, следовательно, качества рендеринга.