20260625:很多新内容

This commit is contained in:
2026-06-25 14:08:47 +08:00
parent 91fac5b6fc
commit 6021dea160
375 changed files with 19263 additions and 251 deletions

View File

@@ -57,7 +57,12 @@ x-prediction 在 [[embedded-language-flows|ELF]] 中至关重要:它与解码
[[embedded-language-flows|ELF]] 将 Flow Matching 应用于语言生成:离散 token → T5 编码 → 连续嵌入空间 → Flow Matching 去噪 → 最后一步解码回 token。
## 在 Wan-Streamer 中的应用
[[wan-streamer|Wan-Streamer]] 使用条件流匹配conditional flow matching联合生成音频和视频响应。同一个 clean streaming context用户观测 + 已提交的 Agent 响应)同时条件化音频和视频速度场的预测,使语音、动作、外观和场景演化作为一个耦合响应进行优化。去噪后的 clean latents 直接追加到历史上下文中。
## 参考
- Lipman et al., "Flow Matching for Generative Modeling", ICLR 2023
- Albergo & Vanden-Eijnden, "Stochastic Interpolants", JMLR 2025
- [[wan-streamer]] — 条件流匹配在端到端流式音视频交互中的应用