Score: 0

ConvRot: Rotation-Based Plug-and-Play 4-bit Quantization for Diffusion Transformers

Published: December 3, 2025 | arXiv ID: 2512.03673v1

By: Feice Huang , Zuliang Han , Xing Zhou and more

Potential Business Impact:

Makes AI image generators faster and smaller.

Business Areas:

Image Recognition Data and Analytics, Software

Diffusion transformers have demonstrated strong capabilities in generating high-quality images. However, as model size increases, the growing memory footprint and inference latency pose significant challenges for practical deployment. Recent studies in large language models (LLMs) show that rotation-based techniques can smooth outliers and enable 4-bit quantization, but these approaches often incur substantial overhead and struggle with row-wise outliers in diffusion transformers. To address these challenges, we propose ConvRot, a group-wise rotation-based quantization method that leverages regular Hadamard transform (RHT) to suppress both row-wise and column-wise outliers while reducing complexity from quadratic to linear. Building on this, we design ConvLinear4bit, a plug-and-play module that integrates rotation, quantization, GEMM, and dequantization, enabling W4A4 inference without retraining and preserving visual quality. Experiments on FLUX.1-dev demonstrate a 2.26$\times$ speedup and 4.05$\times$ memory reduction while maintaining image fidelity. To our knowledge, this is the first application of rotation-based quantization for plug-and-play W4A4 inference in diffusion transformers.

HQ-DM: Single Hadamard Transformation-Based Quantization-Aware Training for Low-Bit Diffusion Models

CV and Pattern Recognition

Makes AI image makers faster and smaller.

5 Dec 2025 1

89%

LRQ-DiT: Log-Rotation Post-Training Quantization of Diffusion Transformers for Image and Video Generation

CV and Pattern Recognition

Makes AI image and video tools smaller, faster.

5 Aug 2025 0

89%

TR-DQ: Time-Rotation Diffusion Quantization

CV and Pattern Recognition

Makes AI art creation faster and use less memory.

9 Mar 2025 1

View PDF Login to Bookmark

Page Count

15 pages

ConvRot: Rotation-Based Plug-and-Play 4-bit Quantization for Diffusion Transformers

Makes AI image generators faster and smaller.

Technical Abstract

HQ-DM: Single Hadamard Transformation-Based Quantization-Aware Training for Low-Bit Diffusion Models

LRQ-DiT: Log-Rotation Post-Training Quantization of Diffusion Transformers for Image and Video Generation

TR-DQ: Time-Rotation Diffusion Quantization