Что такое VOID?
VOID — это структура удаления объектов из видео, которая сосредоточена на создании физически правдоподобных результатов инпейнтинга, особенно в сценариях, где объекты значительно взаимодействуют со своей средой.
Как работает VOID?
VOID использует модель визуального языка для определения областей, затронутых удалением объекта, и направляет модель диффузии видео для генерации последовательных контрфактических результатов. Она использует процесс доработки в два этапа для повышения качества вывода.
Какие наборы данных используются для обучения VOID?
VOID обучен на новом парном наборе данных, созданном из Kubric (синтетический) и HUMOTO (человеческое движение), чтобы обеспечить эффективное контрфактическое удаление объектов.
Как VOID сравнивается с другими методами удаления объектов из видео?
VOID превосходит предыдущие методы, лучше сохраняя динамику сцены и создавая более реалистичные результаты после удаления объекта.