SidneyZhang/myWiki

Files

Sidney Zhang 91fac5b6fc

20260617:目前有914 页

2026-06-17 15:02:40 +08:00

1.7 KiB

Raw Blame History

title, type, created, tags, sources

title

type

created

tags

sources

Scientific Literature QA — Question Answering over Research Papers

concept

2026-06-04

scientific-literature

question-answering

information-retrieval

ma-intragent-2026

Scientific Literature QA（科学文献问答）

定义：以科学论文、技术报告、学术文献为信息来源的问答任务，要求系统理解专业领域语言、数值精度和跨节逻辑关系。

任务谱系

科学文献 QA 包含多个子任务：

子任务	代表性工作	特点
文献搜索式 QA	PaperQA2, SciMaster	在外部文献库中搜索相关论文后回答
对比/综述问答	PeerQA	需要跨论文比较或论证
开放科学推理	ScienceQA	需要多步推理和领域知识
内容锚定检索	**[[intraview	IntraView]]**

核心挑战

领域语言鸿沟：查询术语（如"表面增强拉曼散射"）与文献中使用的术语（如 SERS、纳米颗粒）可能完全不同
数值精度：实验参数（如"514.5 nm 激光"）的提取需要精确匹配
跨节依赖：方法、结果、讨论之间需要交叉引用
图表信息：关键信息可能在图表而非文本中

评估策略演进

传统评估（BLEU/ROUGE）难以处理科学术语的同义词和缩写。intrabench 引入的 LLM 锚定多选题评估是一种进步——允许语义等价而非字面匹配。

相关概念

intraview — 科学文献 QA 的一个严格的子任务
intrabench — 首个多领域科学文献 QA 基准
content-grounded-retrieval — 内容锚定作为评估的基础约束