Score: 0

HQ-DM: Single Hadamard Transformation-Based Quantization-Aware Training for Low-Bit Diffusion Models

Published: December 5, 2025 | arXiv ID: 2512.05746v1

By: Shizhuo Mao , Hongtao Zou , Qihu Xie and more

Diffusion models have demonstrated significant applications in the field of image generation. However, their high computational and memory costs pose challenges for deployment. Model quantization has emerged as a promising solution to reduce storage overhead and accelerate inference. Nevertheless, existing quantization methods for diffusion models struggle to mitigate outliers in activation matrices during inference, leading to substantial performance degradation under low-bit quantization scenarios. To address this, we propose HQ-DM, a novel Quantization-Aware Training framework that applies Single Hadamard Transformation to activation matrices. This approach effectively reduces activation outliers while preserving model performance under quantization. Compared to traditional Double Hadamard Transformation, our proposed scheme offers distinct advantages by seamlessly supporting INT convolution operations while preventing the amplification of weight outliers. For conditional generation on the ImageNet 256x256 dataset using the LDM-4 model, our W4A4 and W4A3 quantization schemes improve the Inception Score by 12.8% and 467.73%, respectively, over the existing state-of-the-art method.

HadaNorm: Diffusion Transformer Quantization through Mean-Centered Transformations

CV and Pattern Recognition

Makes AI art generators work on phones.

11 Jun 2025 2

90%

Gradual Binary Search and Dimension Expansion : A general method for activation quantization in LLMs

Machine Learning (CS)

Makes smart computer brains run faster on phones.

18 Apr 2025 1

90%

Post-Training Quantization for Diffusion Transformer via Hierarchical Timestep Grouping

CV and Pattern Recognition

Makes AI image makers smaller and faster.

10 Mar 2025 2

View PDF Login to Bookmark

HQ-DM: Single Hadamard Transformation-Based Quantization-Aware Training for Low-Bit Diffusion Models

Technical Abstract

HadaNorm: Diffusion Transformer Quantization through Mean-Centered Transformations

Gradual Binary Search and Dimension Expansion : A general method for activation quantization in LLMs

Post-Training Quantization for Diffusion Transformer via Hierarchical Timestep Grouping