SidneyZhang/myWiki

Files

Sidney Zhang b116710e4c

20260514:增加新内容

2026-05-14 13:54:52 +08:00

1.3 KiB

Raw Blame History

title, created, updated, type, tags, sources

title

created

updated

type

tags

sources

领域知识推理 (Domain Knowledge Reasoning)

2026-05-01

2026-05-01

concept

benchmark

llm

papers/dou-cl-bench.md

领域知识推理 (Domain Knowledge Reasoning)

CL-bench 的第一类上下文：模型需从上下文中学习新领域知识并应用来解决任务。是四种类型中最易的一类，最佳成绩 25.3%。

七个子类

子类	典型场景	GPT-5.1 成绩
Finance	新金融产品分析	25.2%
Healthcare	窄领域医学建议	21.7%
Humanities	虚构历史分析	23.7%
Legal Advisory	虚构法律体系断案	22.8%
Lifestyle	专业咨询建议	19.9%
Management	管理场景决策	34.8%
Science	科学领域推理	25.8%

核心特征

上下文提供新的领域知识体系（如一个虚构国家的完整法律）
任务本质是演绎推理：将给定知识应用于具体案例
相对最容易，因为知识是显式陈述的（不像经验发现需要归纳）

相关概念

context-learning — 上下文学习能力
dou-cl-bench — CL-bench 论文
rule-system-application — 规则系统应用
empirical-discovery-simulation — 经验发现（最难类别）