What question did this study set out to answer?

The aim is to introduce TurboDiffusion, a framework to accelerate video generation while preserving quality.

December 22, 2025Open Access

TurboDiffusion: Accelerating Video Diffusion Models by 100-200 Times

Key Points

The aim is to introduce TurboDiffusion, a framework to accelerate video generation while preserving quality.
Utilized low-bit SageAttention and Sparse-Linear Attention for attention acceleration.
Employed rCM for efficient step distillation.
Implemented W8A8 quantization for model parameter and activation compression.
Achieved 100-200x speedup for video generation on a single RTX 5090 GPU.
Maintained comparable video quality with the accelerated process.

Abstract

We introduce TurboDiffusion, a video generation acceleration framework that can speed up end-to-end diffusion generation by 100-200x while maintaining video quality. TurboDiffusion mainly relies on several components for acceleration: (1) Attention acceleration: TurboDiffusion uses low-bit SageAttention and trainable Sparse-Linear Attention (SLA) to speed up attention computation. (2) Step distillation: TurboDiffusion adopts rCM for efficient step distillation. (3) W8A8 quantization: TurboDiffusion quantizes model parameters and activations to 8 bits to accelerate linear layers and compress the model. In addition, TurboDiffusion incorporates several other engineering optimizations. We conduct experiments on the Wan2.2-I2V-14B-720P, Wan2.1-T2V-1.3B-480P, Wan2.1-T2V-14B-720P, and Wan2.1-T2V-14B-480P models. Experimental results show that TurboDiffusion achieves 100-200x speedup for video generation even on a single RTX 5090 GPU, while maintaining comparable video quality. The GitHub repository, which includes model checkpoints and easy-to-use code, is available at https://github.com/thu-ml/TurboDiffusion.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Jintao Zhang

Kaiwen Zheng

Kai Jiang

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

TurboDiffusion: Accelerating Video Diffusion Models by 100-200 Times

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study