Score: 1

MultiMAE for Brain MRIs: Robustness to Missing Inputs Using Multi-Modal Masked Autoencoder

Published: September 14, 2025 | arXiv ID: 2509.11442v1

By: Ayhan Can Erdur , Christian Beischl , Daniel Scholz and more

Potential Business Impact:

Fixes missing brain scans for better medical pictures.

Business Areas:

Image Recognition Data and Analytics, Software

Missing input sequences are common in medical imaging data, posing a challenge for deep learning models reliant on complete input data. In this work, inspired by MultiMAE [2], we develop a masked autoencoder (MAE) paradigm for multi-modal, multi-task learning in 3D medical imaging with brain MRIs. Our method treats each MRI sequence as a separate input modality, leveraging a late-fusion-style transformer encoder to integrate multi-sequence information (multi-modal) and individual decoder streams for each modality for multi-task reconstruction. This pretraining strategy guides the model to learn rich representations per modality while also equipping it to handle missing inputs through cross-sequence reasoning. The result is a flexible and generalizable encoder for brain MRIs that infers missing sequences from available inputs and can be adapted to various downstream applications. We demonstrate the performance and robustness of our method against an MAE-ViT baseline in downstream segmentation and classification tasks, showing absolute improvement of $10.1$ overall Dice score and $0.46$ MCC over the baselines with missing input sequences. Our experiments demonstrate the strength of this pretraining strategy. The implementation is made available.

Multimodal Masked Autoencoder Pre-training for 3D MRI-Based Brain Tumor Analysis with Missing Modalities

CV and Pattern Recognition

Helps doctors see brain tumors better with MRI.

1 May 2025 1

90%

Few-Shot Deployment of Pretrained MRI Transformers in Brain Imaging Tasks

CV and Pattern Recognition

Helps doctors find brain problems with fewer scans.

7 Aug 2025 1

90%

impuTMAE: Multi-modal Transformer with Masked Pre-training for Missing Modalities Imputation in Cancer Survival Prediction

Image and Video Processing

Helps doctors predict cancer survival better.

8 Aug 2025 2

View PDF Login to Bookmark

Repos / Data Links

github.com

Page Count

11 pages

MultiMAE for Brain MRIs: Robustness to Missing Inputs Using Multi-Modal Masked Autoencoder

Fixes missing brain scans for better medical pictures.

Technical Abstract

Multimodal Masked Autoencoder Pre-training for 3D MRI-Based Brain Tumor Analysis with Missing Modalities

Few-Shot Deployment of Pretrained MRI Transformers in Brain Imaging Tasks

impuTMAE: Multi-modal Transformer with Masked Pre-training for Missing Modalities Imputation in Cancer Survival Prediction