57 lines
1.7 KiB
Markdown
57 lines
1.7 KiB
Markdown
---
|
||
title: "Itô 微积分 (Itô Calculus)"
|
||
created: 2026-06-17
|
||
updated: 2026-06-17
|
||
type: concept
|
||
tags: [mathematics, stochastic-processes, calculus, probability]
|
||
sources: [raw/papers/tiwari-ticks-to-flows-2026.md]
|
||
confidence: high
|
||
---
|
||
|
||
# Itô 微积分 (Itô Calculus)
|
||
|
||
Itô 微积分是处理**随机过程积分和微分**的数学框架,是 [[stochastic-differential-equation|SDE]] 理论的核心工具。它在 [[ticks-to-flows|Ticks-to-Flows]] 论文中扮演了从离散到连续的桥梁角色。
|
||
|
||
## Itô 积分
|
||
|
||
将确定性的 Riemann 积分推广到随机积分:
|
||
|
||
```
|
||
∫_0^t σ(X_l) dW_l
|
||
```
|
||
|
||
其中 `dW_l` 是 [[wiener-process|Wiener 过程]]的增量。不同于确定性积分,Itô 积分使用**左端点取值**:`σ(X_{t_j}) * (W_{t_{j+1}} - W_{t_j})`。
|
||
|
||
## Itô 引理 (Itô's Lemma)
|
||
|
||
随机版本的连锁法则(chain rule)——如果 `f(X_t)` 且 `X_t` 服从 SDE,则:
|
||
|
||
```
|
||
df(X_t) = f'(X_t) dX_t + (1/2) f''(X_t) σ(X_t)^2 dt
|
||
```
|
||
|
||
第二项(额外二阶项)是随机分析区别于确定性微积分的关键特征。
|
||
|
||
## Itô-Taylor 展开
|
||
|
||
在 [[ticks-to-flows|Tiwari et al. (2026)]] 的证明中,**Itô-Taylor 展开**被用于将状态随机变量 `s̃_{t,τ}` 表示为 NN 参数 `W^τ - W^0` 的多项式:
|
||
|
||
```
|
||
s̃_{t,τ} ≈ 多项式(W^τ - W^0)
|
||
```
|
||
|
||
这使得可以在梯度时间尺度上追踪状态分布的变化。
|
||
|
||
## 在 RL 理论中的应用
|
||
|
||
- 推导梯度步骤中状态分布的**瞬时变化方程**
|
||
- 证明**条件高斯极限**(结合 [[martingale-clt|鞅 CLT]])
|
||
- 建立 [[two-time-scale-process|双时间尺度]] 过程的解析表达
|
||
|
||
## 参考
|
||
|
||
- [[stochastic-differential-equation|SDE]]
|
||
- [[wiener-process|维纳过程]]
|
||
- [[martingale-clt|鞅 CLT]]
|
||
- [[ticks-to-flows|Ticks to Flows]]
|