2.7 KiB
2.7 KiB
title, author, source, date, url, type
| title | author | source | date | url | type |
|---|---|---|---|---|---|
| 时序预测增强方法综述:从频域到 TPS | Sai Nitesh Palamakula (译:于腾凯) | DeepHub IMBA / 数据派THU (微信公众号) | 2026-05 | https://mp.weixin.qq.com/s/hPvx3OflUva1olME9F8FoA | article |
时序预测增强方法综述:从频域到 Temporal Patch Shuffle
来源:DeepHub IMBA / 数据派THU
核心问题
时间序列预测的增强与分类增强有本质区别——预测目标是连续信号,而非离散标签。 经典分类增强(jittering、scaling、warping)会破坏 look-back 窗口与预测 horizon 之间的连续性, 导致 input-target 不一致。
核心原则:增强必须作用于拼接后的完整序列 s = x ∥ y,再切分回输入和目标,以确保数据-标签一致性。
方法分类体系
基于频率
- RobustTAD:DFT → 幅度/相位扰动 → IDFT
- FreqMask:FFT → 二值 mask 清零选定频率 → IFFT
- FreqMix:FFT → 两序列频谱混合 → IFFT
- WaveMask:DWT 分解 → 各层选择性 mask 小波系数 → 逆 DWT
- WaveMix:DWT 分解 → 两序列小波系数交叉混合 → 逆 DWT
- Dominant Shuffle:FFT → 选 top-k 主导频率 shuffle → IFFT
基于分解
- STAug:EMD → IMF → mixup 式重组(内存开销大,大数据集受限)
其他
- wDBA:DTW 对齐下的时序平均
- MBB:STL 分解 + 残差 bootstrap
- Upsample:线性插值拉伸局部片段
基于 Patch
- TPS (Temporal Patch Shuffle):重叠 patch → variance 评分 → 选择性 shuffle → 重叠区域平均重建
TPS 核心流程
- 拼接:x ∥ y → s(强制数据-标签一致性)
- Temporal Patching:patch 长度 p、stride s,提取重叠 patch
- Variance 评分:跨通道计算每个 patch 的 variance
- 选择性 Shuffle:低 variance 的 α 比例 patch 被随机置换
- 重建:重叠区域取平均,平滑 shuffle 引入的不连续性
- 拆分:s̃ → x̃, ỹ
消融实验关键发现
- 数据-标签一致性:决定性因素,单一消融中性能下降最大
- 重叠 patch:换成非重叠→明显退化,重叠是保留局部时间结构的闸门
- Variance 排序:适度红利,α=1.0 时失去意义
- 时域优于频域:FFT 变换后的 patch 操作会退化
- Shuffle 比例:0.7-1.0 最优
实验结果
- 长期预测:9 个数据集、5 个骨干(TSMixer、DLinear、PatchTST、TiDE、LightTS),TPS 全部最佳
- 短期交通预测:4 个 PeMS 数据集(PatchTST),MSE 提升 2.34%-7.14%
- 分类扩展:UCR + UEA 基准,准确率分别提升 0.50% 和 1.10%