SidneyZhang/myWiki

Files

Sidney Zhang e96b955fda

20260601

2026-06-01 10:46:01 +08:00

2.7 KiB

Raw Blame History

title, author, source, date, url, type

title	author	source	date	url	type
时序预测增强方法综述：从频域到 TPS	Sai Nitesh Palamakula (译：于腾凯)	DeepHub IMBA / 数据派THU (微信公众号)	2026-05	https://mp.weixin.qq.com/s/hPvx3OflUva1olME9F8FoA	article

时序预测增强方法综述：从频域到 Temporal Patch Shuffle

来源：DeepHub IMBA / 数据派THU

核心问题

时间序列预测的增强与分类增强有本质区别——预测目标是连续信号，而非离散标签。经典分类增强（jittering、scaling、warping）会破坏 look-back 窗口与预测 horizon 之间的连续性，导致 input-target 不一致。

核心原则：增强必须作用于拼接后的完整序列 s = x ∥ y，再切分回输入和目标，以确保数据-标签一致性。

方法分类体系

基于频率

RobustTAD：DFT → 幅度/相位扰动 → IDFT
FreqMask：FFT → 二值 mask 清零选定频率 → IFFT
FreqMix：FFT → 两序列频谱混合 → IFFT
WaveMask：DWT 分解 → 各层选择性 mask 小波系数 → 逆 DWT
WaveMix：DWT 分解 → 两序列小波系数交叉混合 → 逆 DWT
Dominant Shuffle：FFT → 选 top-k 主导频率 shuffle → IFFT

基于分解

STAug：EMD → IMF → mixup 式重组（内存开销大，大数据集受限）

其他

wDBA：DTW 对齐下的时序平均
MBB：STL 分解 + 残差 bootstrap
Upsample：线性插值拉伸局部片段

基于 Patch

TPS (Temporal Patch Shuffle)：重叠 patch → variance 评分 → 选择性 shuffle → 重叠区域平均重建

TPS 核心流程

拼接：x ∥ y → s（强制数据-标签一致性）
Temporal Patching：patch 长度 p、stride s，提取重叠 patch
Variance 评分：跨通道计算每个 patch 的 variance
选择性 Shuffle：低 variance 的 α 比例 patch 被随机置换
重建：重叠区域取平均，平滑 shuffle 引入的不连续性
拆分：s̃ → x̃, ỹ

消融实验关键发现

数据-标签一致性：决定性因素，单一消融中性能下降最大
重叠 patch：换成非重叠→明显退化，重叠是保留局部时间结构的闸门
Variance 排序：适度红利，α=1.0 时失去意义
时域优于频域：FFT 变换后的 patch 操作会退化
Shuffle 比例：0.7-1.0 最优

实验结果

长期预测：9 个数据集、5 个骨干（TSMixer、DLinear、PatchTST、TiDE、LightTS），TPS 全部最佳
短期交通预测：4 个 PeMS 数据集（PatchTST），MSE 提升 2.34%-7.14%
分类扩展：UCR + UEA 基准，准确率分别提升 0.50% 和 1.10%