Score: 1

Generative Sequential Notification Optimization via Multi-Objective Decision Transformers

Published: September 2, 2025 | arXiv ID: 2509.02458v1

By: Borja Ocejo , Ruofan Wang , Ke Liu and more

BigTech Affiliations: LinkedIn

Potential Business Impact:

Shows people better messages, not annoying ones.

Business Areas:

Machine Learning Artificial Intelligence, Data and Analytics, Software

Notifications are an important communication channel for delivering timely and relevant information. Optimizing their delivery involves addressing complex sequential decision-making challenges under constraints such as message utility and user fatigue. Offline reinforcement learning (RL) methods, such as Conservative Q-Learning (CQL), have been applied to this problem but face practical challenges at scale, including instability, sensitivity to distribution shifts, limited reproducibility, and difficulties with explainability in high-dimensional recommendation settings. We present a Decision Transformer (DT) based framework that reframes policy learning as return-conditioned supervised learning, improving robustness, scalability, and modeling flexibility. Our contributions include a real-world comparison with CQL, a multi-reward design suitable for non-episodic tasks, a quantile regression approach to return-to-go conditioning, and a production-ready system with circular buffer-based sequence processing for near-real-time inference. Extensive offline and online experiments in a deployed notification system show that our approach improves notification utility and overall session activity while minimizing user fatigue. Compared to a multi-objective CQL-based agent, the DT-based approach achieved a +0.72% increase in sessions for notification decision-making at LinkedIn by making notification recommendation more relevant.

A Comparison Between Decision Transformers and Traditional Offline Reinforcement Learning Algorithms

Machine Learning (CS)

Lets computers learn from past actions better.

20 Nov 2025 0

88%

Online Finetuning Decision Transformers with Pure RL Gradients

Machine Learning (CS)

Teaches AI to learn from its own actions.

1 Jan 2026 1

88%

Robust Adversarial Reinforcement Learning in Stochastic Games via Sequence Modeling

Machine Learning (CS)

Makes smart robots safer from tricky challenges.

13 Oct 2025 1

View PDF Login to Bookmark

Country of Origin

🇺🇸 United States

Page Count

8 pages

Generative Sequential Notification Optimization via Multi-Objective Decision Transformers

Shows people better messages, not annoying ones.

Technical Abstract

A Comparison Between Decision Transformers and Traditional Offline Reinforcement Learning Algorithms

Online Finetuning Decision Transformers with Pure RL Gradients

Robust Adversarial Reinforcement Learning in Stochastic Games via Sequence Modeling