20260514:增加新内容

2026-05-14 13:54:52 +08:00
parent 56c4d3ef7c
commit b116710e4c
294 changed files with 10682 additions and 255 deletions
--- a/concepts/real-life-context-learning.md
+++ b/concepts/real-life-context-learning.md
@@ -0,0 +1,80 @@
+---
+title: 真实生活上下文学习 (Real-Life Context Learning)
+created: 2026-05-01
+updated: 2026-05-01
+type: concept
+tags: [llm, benchmark, alignment]
+sources: [papers/hunyuan-team-cl-bench-life.md]
+---
+
+# 真实生活上下文学习 (Real-Life Context Learning)
+
+> 语言模型从**混乱、碎片化、社会性嵌入**的日常上下文中搜索、整理和推理信息以解决任务的能力。与传统专业领域上下文学习的核心区别：上下文性质的根本不同。
+
+## 定义
+
+真实生活上下文学习（Real-Life Context Learning）是指语言模型处理以下类型上下文并从中提取任务所需信息的能力：
+
+- **多参与方、非正式**的沟通记录（群聊、论坛帖子）
+- **碎片化、非结构化**的个人信息片段（笔记、书签、日记）
+- **时序分散、弱标注**的行为轨迹（健身日志、浏览历史、游戏记录）
+
+## 与传统上下文学习的本质区别
+
+| 维度 | 专业领域上下文 | 真实生活上下文 |
+|------|-------------|-------------|
+| 结构 | 结构化文档、代码 | 碎片化、弱结构 |
+| 信息密度 | 高密度、聚焦 | 低密度、噪声混入 |
+| 参与者 | 通常单一来源 | 多参与者、别名交错 |
+| 时序 | 一般线性叙述 | 非线性、跳跃、修订覆盖 |
+| 社会性 | 低（事实性为主） | 高（意图、关系、立场） |
+| 评估标准 | 客观正确性 | 需考虑约束满足、多方利益平衡 |
+
+## 核心挑战
+
+### 1. 信息碎片化
+相关信息分散在多个部分记录中（如跨数月的群聊历史），模型需要**线索拼接**（clue stitching）能力。
+
+### 2. 身份指代消解
+在群聊中，同一人可能有多个别名，不同发言者的立场和关系需要跨多轮推断。CL-bench Life 实验表明这是模型的**系统性弱点**。
+
+### 3. 噪声过滤
+真实生活上下文包含大量与任务无关的内容（闲聊、表情、题外话），模型需要区分信号与噪声。
+
+### 4. 隐式模式识别
+行为轨迹类任务要求模型从弱标注的长序列中**聚合微小事件、推断潜模式**，而不依赖显式标注。
+
+### 5. 时序推理
+跨时间窗口的信息变化（修订覆盖、版本迭代、约束演变）需要模型追踪信息的时间线。
+
+## 与长上下文能力的解耦
+
+CL-bench Life 的核心发现之一是：真实生活上下文学习能力**与长上下文能力不直接等价**：
+
+- 上下文长度范围 5.4K–170.8K，均在当前前沿模型的上下文窗口内
+- 解决率与上下文长度**无强相关性**
+- GPT-5.4 在最长区间（>32K）取得最高解决率
+- **真正瓶颈在于**混乱上下文的推理质量，而非容量
+
+## 能力维度框架
+
+真实生活上下文学习可分解为以下子能力：
+
+1. **上下文组织** (Context Organization)：从混乱输入中结构化和排序信息
+2. **信息整合** (Information Integration)：跨多个碎片合并证据
+3. **约束追踪** (Constraint Tracking)：在多人对话中追踪约束的增减变化
+4. **身份推理** (Identity Reasoning)：消解别名、追踪关系、推断立场
+5. **时序感知** (Temporal Awareness)：理解信息的时序依赖和因果链
+6. **噪声容忍** (Noise Tolerance)：在大量不相关信息中保持精确
+
+## 相关概念
+- [[cl-bench-life]] — CL-bench Life 基准
+- [[context-misuse]] — 上下文误用
+- [[messy-context-reasoning]] — 混乱上下文推理
+- [[context-learning]] — 通用上下文学习（专业领域）
+- [[hunyuan-team-cl-bench-life]] — 论文详情
+- [[identity-reference-resolution]] — 身份指代消解
+
+---
+
+*Last Updated: 2026-05-01*