Score: 1

CoIRL-AD: Collaborative-Competitive Imitation-Reinforcement Learning in Latent World Models for Autonomous Driving

Published: October 14, 2025 | arXiv ID: 2510.12560v1

By: Xiaoji Zheng , Ziyuan Yang , Yanhao Chen and more

Potential Business Impact:

Makes self-driving cars safer and better drivers.

Business Areas:

Machine Learning Artificial Intelligence, Data and Analytics, Software

End-to-end autonomous driving models trained solely with imitation learning (IL) often suffer from poor generalization. In contrast, reinforcement learning (RL) promotes exploration through reward maximization but faces challenges such as sample inefficiency and unstable convergence. A natural solution is to combine IL and RL. Moving beyond the conventional two-stage paradigm (IL pretraining followed by RL fine-tuning), we propose CoIRL-AD, a competitive dual-policy framework that enables IL and RL agents to interact during training. CoIRL-AD introduces a competition-based mechanism that facilitates knowledge exchange while preventing gradient conflicts. Experiments on the nuScenes dataset show an 18% reduction in collision rate compared to baselines, along with stronger generalization and improved performance on long-tail scenarios. Code is available at: https://github.com/SEU-zxj/CoIRL-AD.

AD-R1: Closed-Loop Reinforcement Learning for End-to-End Autonomous Driving with Impartial World Models

CV and Pattern Recognition

Teaches self-driving cars to avoid crashes.

25 Nov 2025 0

90%

IRL-DAL: Safe and Adaptive Trajectory Planning for Autonomous Driving via Energy-Guided Diffusion Models

Robotics

Teaches cars to drive safely and avoid crashes.

30 Jan 2026 0

90%

RAD: Training an End-to-End Driving Policy via Large-Scale 3DGS-based Reinforcement Learning

CV and Pattern Recognition

Cars learn to drive safely by practicing in a game.

18 Feb 2025 1

View PDF Login to Bookmark

Country of Origin

🇨🇳 China

Repos / Data Links

github.com

Page Count

18 pages

CoIRL-AD: Collaborative-Competitive Imitation-Reinforcement Learning in Latent World Models for Autonomous Driving

Makes self-driving cars safer and better drivers.

Technical Abstract

AD-R1: Closed-Loop Reinforcement Learning for End-to-End Autonomous Driving with Impartial World Models

IRL-DAL: Safe and Adaptive Trajectory Planning for Autonomous Driving via Energy-Guided Diffusion Models

RAD: Training an End-to-End Driving Policy via Large-Scale 3DGS-based Reinforcement Learning