上下文误用 (Context Misuse)

语言模型已经读取并关注了上下文信息，但未能正确推理或整合这些信息的失败模式。区别于"上下文忽略"(Context Ignored)，是当前 LLM 上下文学习的首要瓶颈。

定义

上下文误用（Context Misuse）是 cl-bench-life 评估框架中识别的最主要失败类型，指模型：

这区别于 上下文忽略（Context Ignored）——模型完全未使用某条关键信息。

模型正确提取了多条信息，但在合并时出现了逻辑矛盾。例如：

模型对上下文中的不同证据赋予错误的重要性权重，将次要信息视为核心依据。

在处理跨时间窗口的信息时，将早期版本的约束误认为当前版本的约束。

群聊场景中，将一个参与者的观点或行为错误归属给另一个参与者。

基于上下文中的部分线索"脑补"出实际上不存在的约束或事件。

在 CL-bench Life 的十模型评估中：

关键洞察：上下文误用的占比远超上下文忽略。这意味着即使模型"看到了"所有相关信息，也无法可靠地推理这些信息。

上下文误用可能反映了当前 Transformer 架构在以下方面的局限：

但 CL-bench Life 的数据表明，上下文误用并不仅是位置偏差的问题——即使在较短的上下文中，模型仍然频繁出现推理错误。