20260625:很多新内容
This commit is contained in:
@@ -57,7 +57,12 @@ x-prediction 在 [[embedded-language-flows|ELF]] 中至关重要:它与解码
|
||||
|
||||
[[embedded-language-flows|ELF]] 将 Flow Matching 应用于语言生成:离散 token → T5 编码 → 连续嵌入空间 → Flow Matching 去噪 → 最后一步解码回 token。
|
||||
|
||||
## 在 Wan-Streamer 中的应用
|
||||
|
||||
[[wan-streamer|Wan-Streamer]] 使用条件流匹配(conditional flow matching)联合生成音频和视频响应。同一个 clean streaming context(用户观测 + 已提交的 Agent 响应)同时条件化音频和视频速度场的预测,使语音、动作、外观和场景演化作为一个耦合响应进行优化。去噪后的 clean latents 直接追加到历史上下文中。
|
||||
|
||||
## 参考
|
||||
|
||||
- Lipman et al., "Flow Matching for Generative Modeling", ICLR 2023
|
||||
- Albergo & Vanden-Eijnden, "Stochastic Interpolants", JMLR 2025
|
||||
- [[wan-streamer]] — 条件流匹配在端到端流式音视频交互中的应用
|
||||
|
||||
Reference in New Issue
Block a user