Score: 0

Measuring Time-Series Dataset Similarity using Wasserstein Distance

Published: July 29, 2025 | arXiv ID: 2507.22189v1

By: Hongjie Chen , Akshay Mehra , Josh Kimball and more

Potential Business Impact:

Finds similar patterns in data over time.

Business Areas:

Predictive Analytics Artificial Intelligence, Data and Analytics, Software

The emergence of time-series foundation model research elevates the growing need to measure the (dis)similarity of time-series datasets. A time-series dataset similarity measure aids research in multiple ways, including model selection, finetuning, and visualization. In this paper, we propose a distribution-based method to measure time-series dataset similarity by leveraging the Wasserstein distance. We consider a time-series dataset an empirical instantiation of an underlying multivariate normal distribution (MVN). The similarity between two time-series datasets is thus computed as the Wasserstein distance between their corresponding MVNs. Comprehensive experiments and visualization show the effectiveness of our approach. Specifically, we show how the Wasserstein distance helps identify similar time-series datasets and facilitates inference performance estimation of foundation models in both out-of-distribution and transfer learning evaluation, with high correlations between our proposed measure and the inference loss (>0.60).

Wireless Dataset Similarity: Measuring Distances in Supervised and Unsupervised Machine Learning

Machine Learning (CS)

Helps wireless devices learn from different data.

3 Jan 2026 0

88%

Wasserstein Regression as a Variational Approximation of Probabilistic Trajectories through the Bernstein Basis

Machine Learning (CS)

Teaches computers to predict patterns smoothly.

30 Oct 2025 0

87%

Wasserstein-based Kernels for Clustering: Application to Power Distribution Graphs

Machine Learning (CS)

Groups similar complex things, even without numbers.

18 Mar 2025 0

View PDF Login to Bookmark

Page Count

14 pages

Measuring Time-Series Dataset Similarity using Wasserstein Distance

Finds similar patterns in data over time.

Technical Abstract

Wireless Dataset Similarity: Measuring Distances in Supervised and Unsupervised Machine Learning

Wasserstein Regression as a Variational Approximation of Probabilistic Trajectories through the Bernstein Basis

Wasserstein-based Kernels for Clustering: Application to Power Distribution Graphs