Key points are not available for this paper at this time.
Die Erstellung fotorealistischer Free-Viewpoint-Videos (FVVs) dynamischer Szenen aus Multi-View-Videos bleibt eine Herausforderung. Trotz bemerkenswerter Fortschritte aktueller neuraler Rendering-Techniken erfordern diese Methoden in der Regel vollständige Videosequenzen für das Offline-Training und sind nicht für Echtzeit-Rendering geeignet. Um diese Einschränkungen zu überwinden, stellen wir 3DGStream vor, eine Methode für effizientes FVV-Streaming realer dynamischer Szenen. Unsere Methode erreicht eine schnelle On-the-Fly-Rekonstruktion pro Frame innerhalb von 12 Sekunden und Echtzeit-Rendering mit 200 FPS. Konkret verwenden wir 3D-Gaussern (3DGs) zur Repräsentation der Szene. Anstelle des naiven Ansatzes, 3DGs direkt pro Frame zu optimieren, nutzen wir einen kompakten Neural Transformation Cache (NTC), um die Translationen und Rotationen der 3DGs zu modellieren, was die Trainingszeit und den Speicherbedarf pro FVV-Frame deutlich reduziert. Außerdem schlagen wir eine adaptive Strategie zum Hinzufügen von 3DGs vor, um neu auftretende Objekte in dynamischen Szenen zu erfassen. Experimente zeigen, dass 3DGStream hinsichtlich Rendering-Geschwindigkeit, Bildqualität, Trainingszeit und Modellgröße mit modernen Methoden konkurriert.
Building similarity graph...
Analyzing shared references across papers
Loading...
Jiakai Sun
Jiao Han
Guangyuan Li
Building similarity graph...
Analyzing shared references across papers
Loading...
Sun et al. (Sun,) haben diese Fragestellung untersucht.
www.synapsesocial.com/papers/68e75efdb6db6435876d617c — DOI: https://doi.org/10.48550/arxiv.2403.01444
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: