Score: 2

LampQ: Towards Accurate Layer-wise Mixed Precision Quantization for Vision Transformers

Published: November 13, 2025 | arXiv ID: 2511.10004v1

By: Minjun Kim , Jaeri Lee , Jongjin Kim and more

Potential Business Impact:

Makes AI image tools smaller and faster.

Business Areas:

Image Recognition Data and Analytics, Software

How can we accurately quantize a pre-trained Vision Transformer model? Quantization algorithms compress Vision Transformers (ViTs) into low-bit formats, reducing memory and computation demands with minimal accuracy degradation. However, existing methods rely on uniform precision, ignoring the diverse sensitivity of ViT components to quantization. Metric-based Mixed Precision Quantization (MPQ) is a promising alternative, but previous MPQ methods for ViTs suffer from three major limitations: 1) coarse granularity, 2) mismatch in metric scale across component types, and 3) quantization-unaware bit allocation. In this paper, we propose LampQ (Layer-wise Mixed Precision Quantization for Vision Transformers), an accurate metric-based MPQ method for ViTs to overcome these limitations. LampQ performs layer-wise quantization to achieve both fine-grained control and efficient acceleration, incorporating a type-aware Fisher-based metric to measure sensitivity. Then, LampQ assigns bit-widths optimally through integer linear programming and further updates them iteratively. Extensive experiments show that LampQ provides the state-of-the-art performance in quantizing ViTs pre-trained on various tasks such as image classification, object detection, and zero-shot quantization.

Mix-QViT: Mixed-Precision Vision Transformer Quantization Driven by Layer Importance and Quantization Sensitivity

CV and Pattern Recognition

Makes computer vision models smaller and faster.

10 Jan 2025 1

92%

Towards Understanding Best Practices for Quantization of Vision-Language Models

CV and Pattern Recognition

Makes AI models smaller and faster.

21 Jan 2026 2

91%

IPTQ-ViT: Post-Training Quantization of Non-linear Functions for Integer-only Vision Transformers

CV and Pattern Recognition

Makes computer vision faster without losing quality.

19 Nov 2025 1

View PDF Login to Bookmark

Country of Origin

🇰🇷 Korea, Republic of

Repos / Data Links

github.com

Page Count

13 pages

LampQ: Towards Accurate Layer-wise Mixed Precision Quantization for Vision Transformers

Makes AI image tools smaller and faster.

Technical Abstract

Mix-QViT: Mixed-Precision Vision Transformer Quantization Driven by Layer Importance and Quantization Sensitivity

Towards Understanding Best Practices for Quantization of Vision-Language Models

IPTQ-ViT: Post-Training Quantization of Non-linear Functions for Integer-only Vision Transformers