Files
myWiki/raw/articles/tps-time-series-augmentation-survey-2026.md
2026-06-01 10:46:01 +08:00

65 lines
2.7 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

---
title: "时序预测增强方法综述:从频域到 TPS"
author: "Sai Nitesh Palamakula (译:于腾凯)"
source: "DeepHub IMBA / 数据派THU (微信公众号)"
date: "2026-05"
url: "https://mp.weixin.qq.com/s/hPvx3OflUva1olME9F8FoA"
type: "article"
---
# 时序预测增强方法综述:从频域到 Temporal Patch Shuffle
**来源**DeepHub IMBA / 数据派THU
## 核心问题
时间序列预测的增强与分类增强有本质区别——预测目标是连续信号,而非离散标签。
经典分类增强jittering、scaling、warping会破坏 look-back 窗口与预测 horizon 之间的连续性,
导致 input-target 不一致。
**核心原则**:增强必须作用于拼接后的完整序列 s = x ∥ y再切分回输入和目标以确保数据-标签一致性。
## 方法分类体系
### 基于频率
- **RobustTAD**DFT → 幅度/相位扰动 → IDFT
- **FreqMask**FFT → 二值 mask 清零选定频率 → IFFT
- **FreqMix**FFT → 两序列频谱混合 → IFFT
- **WaveMask**DWT 分解 → 各层选择性 mask 小波系数 → 逆 DWT
- **WaveMix**DWT 分解 → 两序列小波系数交叉混合 → 逆 DWT
- **Dominant Shuffle**FFT → 选 top-k 主导频率 shuffle → IFFT
### 基于分解
- **STAug**EMD → IMF → mixup 式重组(内存开销大,大数据集受限)
### 其他
- **wDBA**DTW 对齐下的时序平均
- **MBB**STL 分解 + 残差 bootstrap
- **Upsample**:线性插值拉伸局部片段
### 基于 Patch
- **TPS (Temporal Patch Shuffle)**:重叠 patch → variance 评分 → 选择性 shuffle → 重叠区域平均重建
## TPS 核心流程
1. **拼接**x ∥ y → s强制数据-标签一致性)
2. **Temporal Patching**patch 长度 p、stride s提取重叠 patch
3. **Variance 评分**:跨通道计算每个 patch 的 variance
4. **选择性 Shuffle**:低 variance 的 α 比例 patch 被随机置换
5. **重建**:重叠区域取平均,平滑 shuffle 引入的不连续性
6. **拆分**s̃ → x̃, ỹ
## 消融实验关键发现
1. **数据-标签一致性**:决定性因素,单一消融中性能下降最大
2. **重叠 patch**:换成非重叠→明显退化,重叠是保留局部时间结构的闸门
3. **Variance 排序**:适度红利,α=1.0 时失去意义
4. **时域优于频域**FFT 变换后的 patch 操作会退化
5. **Shuffle 比例**0.7-1.0 最优
## 实验结果
- **长期预测**9 个数据集、5 个骨干TSMixer、DLinear、PatchTST、TiDE、LightTSTPS 全部最佳
- **短期交通预测**4 个 PeMS 数据集PatchTSTMSE 提升 2.34%-7.14%
- **分类扩展**UCR + UEA 基准,准确率分别提升 0.50% 和 1.10%