Files
myWiki/concepts/domain-knowledge-reasoning.md

1.3 KiB

title, created, updated, type, tags, sources
title created updated type tags sources
领域知识推理 (Domain Knowledge Reasoning) 2026-05-01 2026-05-01 concept
benchmark
llm
papers/dou-cl-bench.md

领域知识推理 (Domain Knowledge Reasoning)

CL-bench 的第一类上下文:模型需从上下文中学习新领域知识并应用来解决任务。是四种类型中最易的一类,最佳成绩 25.3%。

七个子类

子类 典型场景 GPT-5.1 成绩
Finance 新金融产品分析 25.2%
Healthcare 窄领域医学建议 21.7%
Humanities 虚构历史分析 23.7%
Legal Advisory 虚构法律体系断案 22.8%
Lifestyle 专业咨询建议 19.9%
Management 管理场景决策 34.8%
Science 科学领域推理 25.8%

核心特征

  • 上下文提供新的领域知识体系(如一个虚构国家的完整法律)
  • 任务本质是演绎推理:将给定知识应用于具体案例
  • 相对最容易,因为知识是显式陈述的(不像经验发现需要归纳)

相关概念