Key points are not available for this paper at this time.
Jüngste Fortschritte in der 3D-Generierung nutzen synthetische Datensätze mit Ground-Truth-3D-Assets und vordefinierten Kameras. Das Potenzial der Verwendung von realen Datensätzen, die wesentlich realistischere 3D-Szenen erzeugen können, bleibt jedoch weitgehend unerforscht. In dieser Arbeit beleuchten wir die zentrale Herausforderung der komplexen und szenenspezifischen Kameratrajektorien, die bei realen Aufnahmen vorkommen. Wir stellen Director3D vor, ein robustes Open-World-Text-zu-3D-Generierungsframework, das sowohl reale 3D-Szenen als auch adaptive Kameratrajektorien erzeugt. Dazu (1) nutzen wir zunächst einen Trajectory Diffusion Transformer, der als Kameramann agiert, um die Verteilung der Kameratrajektorien anhand von Textbeschreibungen zu modellieren. (2) Anschließend dient ein gaußgetriebener Multi-View Latent Diffusion Model als Dekorateur, der die Verteilung der Bildsequenzen basierend auf den Kameratrajektorien und Texten modelliert. Dieses Modell, feinabgestimmt auf einem 2D-Diffusionsmodell, generiert direkt pixel-aligned 3D-Gaussianer als unmittelbare 3D-Szenen-Repräsentation für konsistentes Denoising. (3) Abschließend werden die 3D-Gaussianer durch einen neuartigen SDS++-Loss als Detailierer verfeinert, der das Vorwissen des 2D-Diffusionsmodells integriert. Umfangreiche Experimente zeigen, dass Director3D bestehende Methoden übertrifft und überlegene Leistungen bei der realen 3D-Generierung bietet.
Building similarity graph...
Analyzing shared references across papers
Loading...
Li et al. (Tue,) untersuchten diese Fragestellung.
www.synapsesocial.com/papers/68e636c5b6db6435875c8bbd — DOI: https://doi.org/10.48550/arxiv.2406.17601
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context:
Xinyang Li
Zhangyu Lai
Linning Xu
Building similarity graph...
Analyzing shared references across papers
Loading...