--- title: "Shared Parameter Influence" created: 2026-05-18 type: concept tags: ["optimization", "LLM", "theory"] sources: ["https://arxiv.org/abs/2604.14142"] --- # Shared Parameter Influence(共享参数影响) ## 定义 PreRL 理论框架的基本前提:LLM 的参数 θ **同时控制**边际分布 P_θ(y) 和条件分布 P_θ(y|x)。因此,对 P(y) 的更新会"泄露"到 P(y|x),反之亦然。 ## 理论意义 共享参数影响是 [[gradient-alignment|梯度对齐]] 的前提条件: - 如果 θ 独立地参数化 P(y) 和 P(y|x)(如两个独立模型),则 PreRL 无效 - 由于 LLM 的自回归架构,在预测 y_t 时,参数已通过 attention 机制耦合了上下文信息(包括 x),因此修改 log P(y_t|y_{