What type of study is this?

This is a Quantitative Study study.

October 19, 2025Open Access

Reconstruir, Inpaintar, Refinar: Síntese Dinâmica de Novas Perspectivas a partir de Vídeos Monoculares

Key Points

O CogNVS aprimora significativamente a síntese de novas perspectivas para cenas dinâmicas utilizando vídeos monoculares.
O método alcança resultados melhores do que abordagens anteriores ao aproveitar a reconstrução da cena 3D.
Evidências empíricas mostram que o CogNVS se destaca na geração de saídas visuais de alta qualidade em várias novas perspectivas.
O aspecto de aprendizado auto-supervisionado permite uma aplicação mais ampla sem necessidade de conjuntos de dados extensos.

Abstract

Exploramos a síntese de novas perspectivas para cenas dinâmicas a partir de vídeos monoculares. Abordagens anteriores dependem de otimização custosa em tempo de teste de representações 4D ou não preservam a geometria da cena quando treinadas de forma direta. Nossa abordagem baseia-se em três insights chave: (1) pixels covisíveis (visíveis nas vistas de entrada e de destino) podem ser renderizados primeiro reconstruindo a cena 3D dinâmica e renderizando a reconstrução a partir das novas vistas e (2) pixels ocultos nas novas vistas podem ser "inpaintados" com modelos de difusão de vídeo 2D de fluxo direto. Notavelmente, nosso modelo de difusão de inpainting de vídeo (CogNVS) pode ser auto-supervisionado a partir de vídeos 2D, permitindo treinar em um grande corpus de vídeos naturais. Isso, por sua vez, permite (3) a aplicação zero-shot do CogNVS em novos vídeos de teste via refinamento em tempo de teste. Verificamos empiricamente que o CogNVS supera quase todas as abordagens anteriores para síntese de novas perspectivas de cenas dinâmicas a partir de vídeos monoculares.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Cite this study

Chen et al. (qua,) estudaram essa questão.

www.synapsesocial.com/papers/68f4b10d3d9d770bbc696f6b — DOI: https://doi.org/10.48550/arxiv.2507.12646

Also consider

Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context:

ViewCrafter: Taming Video Diffusion Models for High-fidelity Novel View Synthesis· 2025 · 29 citations
Generative Camera Dolly: Extreme Monocular Dynamic Novel View Synthesis· 2024
ViewCrafter: Taming Video Diffusion Models for High-fidelity Novel View Synthesis· 2024 · 3 citations
D-NPC: Dynamic Neural Point Clouds for Non-Rigid View Synthesis from Monocular Video· 2024 · 1 citations
Learning View Synthesis from Minimal Scene Specifications

Authors

Kaihua Chen

Tarasha Khurana

Deva Ramanan

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Reconstruir, Inpaintar, Refinar: Síntese Dinâmica de Novas Perspectivas a partir de Vídeos Monoculares

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Cite this study

Also consider

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion