Files
myWiki/concepts/long-context-understanding.md

38 lines
1.3 KiB
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

---
title: 长上下文理解 (Long-Context Understanding)
created: 2026-05-01
updated: 2026-05-01
type: concept
tags: [llm, architecture, benchmark]
sources: [papers/hunyuan-team-cl-bench-life.md]
---
# 长上下文理解 (Long-Context Understanding)
> 语言模型在超长输入序列10K1M+ tokens中检索信息和进行推理的能力。与 [[real-life-context-learning]] 相关但不等价。
## 定义
长上下文理解考察模型在以下方面的表现:
- **信息检索**能否在长文本中的任意位置找到特定事实Needle-in-a-Haystack
- **多跳推理**:能否组合分散在不同位置的信息
- **位置鲁棒性**:性能是否随目标信息位置变化(如 [[lost-in-the-middle]]
## 与真实生活上下文学习的解耦
CL-bench Life 的重要发现:**长上下文能力 ≠ 真实生活上下文学习能力**
- CL-bench Life 的上下文长度5.4K170.8K)在大多数前沿模型窗口内
- 任务解决率与上下文长度**无强相关性**
- 混乱上下文的推理质量是独立于上下文长度的瓶颈
## 相关概念
- [[context-learning]] — 通用上下文学习
- [[real-life-context-learning]] — 真实生活上下文学习
- [[lost-in-the-middle]] — 中间信息丢失
- [[million-token-context]] — 百万 Token 上下文
---
*Last Updated: 2026-05-01*