1.7 KiB
1.7 KiB
title, created, updated, type, tags, sources, confidence
| title | created | updated | type | tags | sources | confidence | |||||
|---|---|---|---|---|---|---|---|---|---|---|---|
| Itô 微积分 (Itô Calculus) | 2026-06-17 | 2026-06-17 | concept |
|
|
high |
Itô 微积分 (Itô Calculus)
Itô 微积分是处理随机过程积分和微分的数学框架,是 stochastic-differential-equation 理论的核心工具。它在 ticks-to-flows 论文中扮演了从离散到连续的桥梁角色。
Itô 积分
将确定性的 Riemann 积分推广到随机积分:
∫_0^t σ(X_l) dW_l
其中 dW_l 是 wiener-process的增量。不同于确定性积分,Itô 积分使用左端点取值:σ(X_{t_j}) * (W_{t_{j+1}} - W_{t_j})。
Itô 引理 (Itô's Lemma)
随机版本的连锁法则(chain rule)——如果 f(X_t) 且 X_t 服从 SDE,则:
df(X_t) = f'(X_t) dX_t + (1/2) f''(X_t) σ(X_t)^2 dt
第二项(额外二阶项)是随机分析区别于确定性微积分的关键特征。
Itô-Taylor 展开
在 ticks-to-flows 的证明中,Itô-Taylor 展开被用于将状态随机变量 s̃_{t,τ} 表示为 NN 参数 W^τ - W^0 的多项式:
s̃_{t,τ} ≈ 多项式(W^τ - W^0)
这使得可以在梯度时间尺度上追踪状态分布的变化。
在 RL 理论中的应用
- 推导梯度步骤中状态分布的瞬时变化方程
- 证明条件高斯极限(结合 martingale-clt)
- 建立 two-time-scale-process 过程的解析表达