Files
myWiki/concepts/scientific-literature-qa.md

40 lines
1.7 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

---
title: "Scientific Literature QA — Question Answering over Research Papers"
type: concept
created: 2026-06-04
tags: [scientific-literature, question-answering, information-retrieval]
sources: ["ma-intragent-2026"]
---
# Scientific Literature QA科学文献问答
**定义**:以科学论文、技术报告、学术文献为信息来源的问答任务,要求系统理解专业领域语言、数值精度和跨节逻辑关系。
## 任务谱系
科学文献 QA 包含多个子任务:
| 子任务 | 代表性工作 | 特点 |
|--------|-----------|------|
| 文献搜索式 QA | PaperQA2, SciMaster | 在外部文献库中搜索相关论文后回答 |
| 对比/综述问答 | PeerQA | 需要跨论文比较或论证 |
| 开放科学推理 | ScienceQA | 需要多步推理和领域知识 |
| **内容锚定检索** | **[[intraview|IntraView]]** | **严格限定于单篇论文内容** |
## 核心挑战
1. **领域语言鸿沟**:查询术语(如"表面增强拉曼散射")与文献中使用的术语(如 SERS、纳米颗粒可能完全不同
2. **数值精度**:实验参数(如"514.5 nm 激光")的提取需要精确匹配
3. **跨节依赖**:方法、结果、讨论之间需要交叉引用
4. **图表信息**:关键信息可能在图表而非文本中
## 评估策略演进
传统评估BLEU/ROUGE难以处理科学术语的同义词和缩写。[[intrabench|IntraBench]] 引入的 LLM 锚定多选题评估是一种进步——允许语义等价而非字面匹配。
## 相关概念
- [[intraview|IntraView]] — 科学文献 QA 的一个严格的子任务
- [[intrabench|IntraBench]] — 首个多领域科学文献 QA 基准
- [[content-grounded-retrieval]] — 内容锚定作为评估的基础约束