20260617:目前有914 页

2026-06-17 15:02:40 +08:00
parent e96b955fda
commit 91fac5b6fc
423 changed files with 20687 additions and 34 deletions
--- a/concepts/scientific-literature-qa.md
+++ b/concepts/scientific-literature-qa.md
@@ -0,0 +1,39 @@
+---
+title: "Scientific Literature QA — Question Answering over Research Papers"
+type: concept
+created: 2026-06-04
+tags: [scientific-literature, question-answering, information-retrieval]
+sources: ["ma-intragent-2026"]
+---
+
+# Scientific Literature QA（科学文献问答）
+
+**定义**：以科学论文、技术报告、学术文献为信息来源的问答任务，要求系统理解专业领域语言、数值精度和跨节逻辑关系。
+
+## 任务谱系
+
+科学文献 QA 包含多个子任务：
+
+| 子任务 | 代表性工作 | 特点 |
+|--------|-----------|------|
+| 文献搜索式 QA | PaperQA2, SciMaster | 在外部文献库中搜索相关论文后回答 |
+| 对比/综述问答 | PeerQA | 需要跨论文比较或论证 |
+| 开放科学推理 | ScienceQA | 需要多步推理和领域知识 |
+| **内容锚定检索** | **[[intraview|IntraView]]** | **严格限定于单篇论文内容** |
+
+## 核心挑战
+
+1. **领域语言鸿沟**：查询术语（如"表面增强拉曼散射"）与文献中使用的术语（如 SERS、纳米颗粒）可能完全不同
+2. **数值精度**：实验参数（如"514.5 nm 激光"）的提取需要精确匹配
+3. **跨节依赖**：方法、结果、讨论之间需要交叉引用
+4. **图表信息**：关键信息可能在图表而非文本中
+
+## 评估策略演进
+
+传统评估（BLEU/ROUGE）难以处理科学术语的同义词和缩写。[[intrabench|IntraBench]] 引入的 LLM 锚定多选题评估是一种进步——允许语义等价而非字面匹配。
+
+## 相关概念
+
+- [[intraview|IntraView]] — 科学文献 QA 的一个严格的子任务
+- [[intrabench|IntraBench]] — 首个多领域科学文献 QA 基准
+- [[content-grounded-retrieval]] — 内容锚定作为评估的基础约束