1.2 KiB
1.2 KiB
title, created, updated, type, tags, sources
| title | created | updated | type | tags | sources | |||
|---|---|---|---|---|---|---|---|---|
| 身份指代消解 (Identity Reference Resolution) | 2026-05-01 | 2026-05-01 | concept |
|
|
身份指代消解 (Identity Reference Resolution)
在多参与者自然语言交互中,确定代词、别名、称呼所指代的具体人物的能力。CL-bench Life 发现这是 LLM 在群聊场景中的系统性弱点。
群聊场景的特殊挑战
在 cl-bench-life 的"沟通与社交互动"类别中,模型频繁出现:
- 别名混淆:同一人有多个称呼,模型无法统一
- 指代歧义:代词"他/她/它"在多个参与者间无法准确消解
- 角色归因错误:将 A 的发言或决策错误归属给 B
- 关系推断失败:无法追踪参与者间的立场、权力关系
评估数据
在群聊与会议子类中,身份相关错误是仅次于"上下文误用"的第二大失败原因。身份混淆直接导致了后续推理的根本性错误。
相关概念
- cl-bench-life — CL-bench Life 基准
- real-life-context-learning — 真实生活上下文学习
- context-misuse — 上下文误用
Last Updated: 2026-05-01