Score: 2

The Uneven Impact of Post-Training Quantization in Machine Translation

Published: August 28, 2025 | arXiv ID: 2508.20893v1

By: Benjamin Marie, Atsushi Fujita

Potential Business Impact:

Makes language translators work on smaller devices.

Business Areas:

Quantum Computing Science and Engineering

Quantization is essential for deploying large language models (LLMs) on resource-constrained hardware, but its implications for multilingual tasks remain underexplored. We conduct the first large-scale evaluation of post-training quantization (PTQ) on machine translation across 55 languages using five LLMs ranging from 1.7B to 70B parameters. Our analysis reveals that while 4-bit quantization often preserves translation quality for high-resource languages and large models, significant degradation occurs for low-resource and typologically diverse languages, particularly in 2-bit settings. We compare four quantization techniques (AWQ, BitsAndBytes, GGUF, and AutoRound), showing that algorithm choice and model size jointly determine robustness. GGUF variants provide the most consistent performance, even at 2-bit precision. Additionally, we quantify the interactions between quantization, decoding hyperparameters, and calibration languages, finding that language-matched calibration offers benefits primarily in low-bit scenarios. Our findings offer actionable insights for deploying multilingual LLMs for machine translation under quantization constraints, especially in low-resource settings.

Rethinking Output Alignment For 1-bit Post-Training Quantization of Large Language Models

Machine Learning (CS)

Makes tiny AI models work almost as well.

25 Dec 2025 0

92%

Quantization Meets dLLMs: A Systematic Study of Post-training Quantization for Diffusion LLMs

Computation and Language

Makes big AI models run on small phones.

20 Aug 2025 1

92%

A Comprehensive Evaluation on Quantization Techniques for Large Language Models

Machine Learning (CS)

Makes AI models smaller and faster.

23 Jul 2025 2

View PDF Login to Bookmark

Repos / Data Links

github.com github.com github.com github.com github.com github.com huggingface.co huggingface.co huggingface.co

Page Count

11 pages

The Uneven Impact of Post-Training Quantization in Machine Translation

Makes language translators work on smaller devices.

Technical Abstract

Rethinking Output Alignment For 1-bit Post-Training Quantization of Large Language Models

Quantization Meets dLLMs: A Systematic Study of Post-training Quantization for Diffusion LLMs

A Comprehensive Evaluation on Quantization Techniques for Large Language Models