Files
myWiki/concepts/tpp-training-methods.md

2.3 KiB
Raw Blame History

title, created, updated, type, tags, sources
title created updated type tags sources
TPP 训练方法 2026-06-16 2026-06-16 concept
temporal-point-process
training
estimation
optimization
raw/papers/advances-temporal-point-processes-2026.md

TPP 训练方法 (Training Methods for TPP)

TPP 模型的参数估计面临独特挑战:连续时间的似然函数通常涉及强度函数的积分。不同训练目标在计算与统计效率间有本质权衡。

四大训练目标

1. 最大似然估计 (MLE)

theta_hat = arg max sum log lambda*(t_n) - ∫_0^T lambda*(tau) dtau
  • 散度类型KL 散度
  • 需要似然:是
  • 需要数值积分:是(强度积分)
  • 统计效率:渐近最优(最小方差)
  • 代表Ozaki (1979), Paninski (2004)

2. Wasserstein 距离训练

theta_hat = arg min W(f_data, f_theta)
  • 散度类型Wasserstein 距离
  • 需要似然:否
  • 需要数值积分:否
  • 统计效率:一致的,方差较高
  • 代表Xiao et al. (2017a, 2018)

3. 噪声对比估计 (NCE)

将参数学习转化为二分类问题——区分真实序列和噪声序列:

Loss = E_{T~real}[log sigma(s_theta(T))] + E_{T~noise}[log(1-sigma(s_theta(T)))]
  • 散度类型:基于分类
  • 需要似然:否
  • 需要数值积分:否
  • 统计效率:一致的,方差较高
  • 代表Guo et al. (2018), Mei et al. (2020)

4. 评分匹配 / Fisher 散度

通过评分函数score function的梯度衡量分布差异

theta_hat = arg min E_f[||∇log f(T) - ∇log f_theta(T)||^2]
  • 散度类型Fisher 散度
  • 需要似然:否(仅需评分函数)
  • 需要数值积分:否
  • 统计效率:一致的,方差较高
  • 代表Sahani et al. (2016), Li et al. (2023), Cao et al. (2024)

关键权衡

  • MLE 统计上最优,但积分开销大
  • 替代方法避免积分但渐近方差更高
  • 选择取决于应用场景的规模 vs 精度需求
  • intensity-free-modeling 是另一种绕过积分的策略(保留 MLE 的效率优势)

参考