--- title: "Position ID Discrepancy (位置 ID 偏差)" created: 2025-06-02 updated: 2025-06-02 type: concept tags: [position-encoding, multi-turn-reasoning, training] sources: ["[[goru-one-pass-to-reason-2025]]"] --- # Position ID Discrepancy > 在多轮推理训练中,回复 token 在"生成时刻"与"作为上下文"两种场景下的位置不一致问题。 ## 问题 考虑第 i 轮对话: **生成时刻**(训练时的前向传播): ``` ... hi-1, ri-1, hi, [ti, ri] ← ri 跟在 ti 后面 ``` ri 的绝对位置:`length(H_{