1.3 KiB
1.3 KiB
title, created, updated, type, tags, sources
| title | created | updated | type | tags | sources | |||
|---|---|---|---|---|---|---|---|---|
| 领域知识推理 (Domain Knowledge Reasoning) | 2026-05-01 | 2026-05-01 | concept |
|
|
领域知识推理 (Domain Knowledge Reasoning)
CL-bench 的第一类上下文:模型需从上下文中学习新领域知识并应用来解决任务。是四种类型中最易的一类,最佳成绩 25.3%。
七个子类
| 子类 | 典型场景 | GPT-5.1 成绩 |
|---|---|---|
| Finance | 新金融产品分析 | 25.2% |
| Healthcare | 窄领域医学建议 | 21.7% |
| Humanities | 虚构历史分析 | 23.7% |
| Legal Advisory | 虚构法律体系断案 | 22.8% |
| Lifestyle | 专业咨询建议 | 19.9% |
| Management | 管理场景决策 | 34.8% |
| Science | 科学领域推理 | 25.8% |
核心特征
- 上下文提供新的领域知识体系(如一个虚构国家的完整法律)
- 任务本质是演绎推理:将给定知识应用于具体案例
- 相对最容易,因为知识是显式陈述的(不像经验发现需要归纳)
相关概念
- context-learning — 上下文学习能力
- dou-cl-bench — CL-bench 论文
- rule-system-application — 规则系统应用
- empirical-discovery-simulation — 经验发现(最难类别)