Files
myWiki/concepts/ito-calculus.md

57 lines
1.7 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

---
title: "Itô 微积分 (Itô Calculus)"
created: 2026-06-17
updated: 2026-06-17
type: concept
tags: [mathematics, stochastic-processes, calculus, probability]
sources: [raw/papers/tiwari-ticks-to-flows-2026.md]
confidence: high
---
# Itô 微积分 (Itô Calculus)
Itô 微积分是处理**随机过程积分和微分**的数学框架,是 [[stochastic-differential-equation|SDE]] 理论的核心工具。它在 [[ticks-to-flows|Ticks-to-Flows]] 论文中扮演了从离散到连续的桥梁角色。
## Itô 积分
将确定性的 Riemann 积分推广到随机积分:
```
∫_0^t σ(X_l) dW_l
```
其中 `dW_l` 是 [[wiener-process|Wiener 过程]]的增量。不同于确定性积分Itô 积分使用**左端点取值**`σ(X_{t_j}) * (W_{t_{j+1}} - W_{t_j})`
## Itô 引理 (Itô's Lemma)
随机版本的连锁法则chain rule——如果 `f(X_t)``X_t` 服从 SDE
```
df(X_t) = f'(X_t) dX_t + (1/2) f''(X_t) σ(X_t)^2 dt
```
第二项(额外二阶项)是随机分析区别于确定性微积分的关键特征。
## Itô-Taylor 展开
在 [[ticks-to-flows|Tiwari et al. (2026)]] 的证明中,**Itô-Taylor 展开**被用于将状态随机变量 `s̃_{t,τ}` 表示为 NN 参数 `W^τ - W^0` 的多项式:
```
s̃_{t,τ} ≈ 多项式(W^τ - W^0)
```
这使得可以在梯度时间尺度上追踪状态分布的变化。
## 在 RL 理论中的应用
- 推导梯度步骤中状态分布的**瞬时变化方程**
- 证明**条件高斯极限**(结合 [[martingale-clt|鞅 CLT]]
- 建立 [[two-time-scale-process|双时间尺度]] 过程的解析表达
## 参考
- [[stochastic-differential-equation|SDE]]
- [[wiener-process|维纳过程]]
- [[martingale-clt|鞅 CLT]]
- [[ticks-to-flows|Ticks to Flows]]