Score: 1

IPTQ-ViT: Post-Training Quantization of Non-linear Functions for Integer-only Vision Transformers

Published: November 19, 2025 | arXiv ID: 2511.15369v1

By: Gihwan Kim, Jemin Lee, Hyungshin Kim

Potential Business Impact:

Makes computer vision faster without losing quality.

Business Areas:

Image Recognition Data and Analytics, Software

Previous Quantization-Aware Training (QAT) methods for vision transformers rely on expensive retraining to recover accuracy loss in non-linear layer quantization, limiting their use in resource-constrained environments. In contrast, existing Post-Training Quantization (PTQ) methods either partially quantize non-linear functions or adjust activation distributions to maintain accuracy but fail to achieve fully integer-only inference. In this paper, we introduce IPTQ-ViT, a novel PTQ framework for fully integer-only vision transformers without retraining. We present approximation functions: a polynomial-based GELU optimized for vision data and a bit-shifting-based Softmax designed to improve approximation accuracy in PTQ. In addition, we propose a unified metric integrating quantization sensitivity, perturbation, and computational cost to select the optimal approximation function per activation layer. IPTQ-ViT outperforms previous PTQ methods, achieving up to 6.44\%p (avg. 1.78\%p) top-1 accuracy improvement for image classification, 1.0 mAP for object detection. IPTQ-ViT outperforms partial floating-point PTQ methods under W8A8 and W4A8, and achieves accuracy and latency comparable to integer-only QAT methods. We plan to release our code https://github.com/gihwan-kim/IPTQ-ViT.git.

AIQViT: Architecture-Informed Post-Training Quantization for Vision Transformers

CV and Pattern Recognition

Makes AI see better with less computer power.

7 Feb 2025 1

91%

GPLQ: A General, Practical, and Lightning QAT Method for Vision Transformers

CV and Pattern Recognition

Makes computer vision faster and smaller.

13 Jun 2025 0

91%

Mix-QViT: Mixed-Precision Vision Transformer Quantization Driven by Layer Importance and Quantization Sensitivity

CV and Pattern Recognition

Makes computer vision models smaller and faster.

10 Jan 2025 1

View PDF Login to Bookmark

Country of Origin

🇰🇷 Korea, Republic of

Repos / Data Links

github.com

Page Count

10 pages

IPTQ-ViT: Post-Training Quantization of Non-linear Functions for Integer-only Vision Transformers

Makes computer vision faster without losing quality.

Technical Abstract

AIQViT: Architecture-Informed Post-Training Quantization for Vision Transformers

GPLQ: A General, Practical, and Lightning QAT Method for Vision Transformers

Mix-QViT: Mixed-Precision Vision Transformer Quantization Driven by Layer Importance and Quantization Sensitivity