Files
myWiki/concepts/interaction-order.md

2.1 KiB
Raw Blame History

title, created, updated, type, tags, sources
title created updated type tags sources
交互阶数 (Interaction Order) 2026-06-03 2026-06-03 concept
interactions
complexity
DNN
LLM
zhang-reconciling-sft-interaction-2026

交互阶数 (Interaction Order / Complexity)

定义

交互的阶数order定义为该交互涉及的输入变量数量

\text{order}(T) = |T|

例如:

  • 两个词 "force" 和 "mass" 之间的交互 → 2 阶(简单短语模式)
  • 五个词 "laws"、"between"、"force"、"mass" 和 "and" 之间的交互 → 5 阶(复杂短语模式)

阶数与可靠性的关系

大量研究发现,低阶交互通常比高阶交互更可靠:

  1. 对噪声更鲁棒:低阶交互对输入噪声的敏感度更低
  2. 泛化性更强:低阶交互更可能跨模型通用(interaction-generalizability
  3. 更少正负抵消:低阶交互的 uncancelled-interaction-effects 更高

在 SFT 分析中的角色

zhang-reconciling-sft-interaction-2026 中,交互阶数是区分可靠交互与噪声交互的关键维度:

交互类型 阶数分布 含义
[[interaction-types-sft Preserved]] 以低阶为主
[[interaction-types-sft Removed]] 以高阶为主
[[interaction-types-sft Newly Emerged早期]] 中低阶
[[interaction-types-sft Newly Emerged后期]] 以高阶为主

交互分布表征

与其逐个分析每个交互的阶数,可以表征交互在不同阶数上的分布

e^+ = [e^{(1),+}, e^{(2),+}, ..., e^{(n),+}]^T e^- = [e^{(1),-}, e^{(2),-}, ..., e^{(n),-}]^T

其中 e^{(k),+} 聚合了所有 k 阶的正效应新涌现交互。

相关概念