Files
myWiki/raw/articles/tps-time-series-augmentation-survey-2026.md
2026-06-01 10:46:01 +08:00

2.7 KiB
Raw Blame History

title, author, source, date, url, type
title author source date url type
时序预测增强方法综述:从频域到 TPS Sai Nitesh Palamakula (译:于腾凯) DeepHub IMBA / 数据派THU (微信公众号) 2026-05 https://mp.weixin.qq.com/s/hPvx3OflUva1olME9F8FoA article

时序预测增强方法综述:从频域到 Temporal Patch Shuffle

来源DeepHub IMBA / 数据派THU

核心问题

时间序列预测的增强与分类增强有本质区别——预测目标是连续信号,而非离散标签。 经典分类增强jittering、scaling、warping会破坏 look-back 窗口与预测 horizon 之间的连续性, 导致 input-target 不一致。

核心原则:增强必须作用于拼接后的完整序列 s = x ∥ y再切分回输入和目标以确保数据-标签一致性。

方法分类体系

基于频率

  • RobustTADDFT → 幅度/相位扰动 → IDFT
  • FreqMaskFFT → 二值 mask 清零选定频率 → IFFT
  • FreqMixFFT → 两序列频谱混合 → IFFT
  • WaveMaskDWT 分解 → 各层选择性 mask 小波系数 → 逆 DWT
  • WaveMixDWT 分解 → 两序列小波系数交叉混合 → 逆 DWT
  • Dominant ShuffleFFT → 选 top-k 主导频率 shuffle → IFFT

基于分解

  • STAugEMD → IMF → mixup 式重组(内存开销大,大数据集受限)

其他

  • wDBADTW 对齐下的时序平均
  • MBBSTL 分解 + 残差 bootstrap
  • Upsample:线性插值拉伸局部片段

基于 Patch

  • TPS (Temporal Patch Shuffle):重叠 patch → variance 评分 → 选择性 shuffle → 重叠区域平均重建

TPS 核心流程

  1. 拼接x ∥ y → s强制数据-标签一致性)
  2. Temporal Patchingpatch 长度 p、stride s提取重叠 patch
  3. Variance 评分:跨通道计算每个 patch 的 variance
  4. 选择性 Shuffle:低 variance 的 α 比例 patch 被随机置换
  5. 重建:重叠区域取平均,平滑 shuffle 引入的不连续性
  6. 拆分s̃ → x̃, ỹ

消融实验关键发现

  1. 数据-标签一致性:决定性因素,单一消融中性能下降最大
  2. 重叠 patch:换成非重叠→明显退化,重叠是保留局部时间结构的闸门
  3. Variance 排序:适度红利,α=1.0 时失去意义
  4. 时域优于频域FFT 变换后的 patch 操作会退化
  5. Shuffle 比例0.7-1.0 最优

实验结果

  • 长期预测9 个数据集、5 个骨干TSMixer、DLinear、PatchTST、TiDE、LightTSTPS 全部最佳
  • 短期交通预测4 个 PeMS 数据集PatchTSTMSE 提升 2.34%-7.14%
  • 分类扩展UCR + UEA 基准,准确率分别提升 0.50% 和 1.10%