Score: 2

State-Aware Perturbation Optimization for Robust Deep Reinforcement Learning

Published: March 26, 2025 | arXiv ID: 2503.20613v1

By: Zongyuan Zhang , Tianyang Duan , Zheng Lin and more

Potential Business Impact:

Makes robots safer by fooling them with tricky inputs.

Business Areas:

Autonomous Vehicles Transportation

Recently, deep reinforcement learning (DRL) has emerged as a promising approach for robotic control. However, the deployment of DRL in real-world robots is hindered by its sensitivity to environmental perturbations. While existing whitebox adversarial attacks rely on local gradient information and apply uniform perturbations across all states to evaluate DRL robustness, they fail to account for temporal dynamics and state-specific vulnerabilities. To combat the above challenge, we first conduct a theoretical analysis of white-box attacks in DRL by establishing the adversarial victim-dynamics Markov decision process (AVD-MDP), to derive the necessary and sufficient conditions for a successful attack. Based on this, we propose a selective state-aware reinforcement adversarial attack method, named STAR, to optimize perturbation stealthiness and state visitation dispersion. STAR first employs a soft mask-based state-targeting mechanism to minimize redundant perturbations, enhancing stealthiness and attack effectiveness. Then, it incorporates an information-theoretic optimization objective to maximize mutual information between perturbations, environmental states, and victim actions, ensuring a dispersed state-visitation distribution that steers the victim agent into vulnerable states for maximum return reduction. Extensive experiments demonstrate that STAR outperforms state-of-the-art benchmarks.

Towards Robust Deep Reinforcement Learning against Environmental State Perturbation

Machine Learning (CS)

Makes robots learn better even when things change.

10 Jun 2025 0

91%

Robust Deep Reinforcement Learning in Robotics via Adaptive Gradient-Masked Adversarial Attacks

Machine Learning (CS)

Tricks robots into making bad choices.

26 Mar 2025 1

88%

Realistic Adversarial Attacks for Robustness Evaluation of Trajectory Prediction Models via Future State Perturbation

Machine Learning (CS)

Makes self-driving cars safer by testing their reactions.

9 May 2025 1

View PDF Login to Bookmark

Country of Origin

🇨🇳 🇭🇰 Hong Kong, China

Page Count

15 pages

State-Aware Perturbation Optimization for Robust Deep Reinforcement Learning

Makes robots safer by fooling them with tricky inputs.

Technical Abstract

Towards Robust Deep Reinforcement Learning against Environmental State Perturbation

Robust Deep Reinforcement Learning in Robotics via Adaptive Gradient-Masked Adversarial Attacks

Realistic Adversarial Attacks for Robustness Evaluation of Trajectory Prediction Models via Future State Perturbation