1.7 KiB
1.7 KiB
title, type, created, tags, sources
| title | type | created | tags | sources | ||||
|---|---|---|---|---|---|---|---|---|
| Scientific Literature QA — Question Answering over Research Papers | concept | 2026-06-04 |
|
|
Scientific Literature QA(科学文献问答)
定义:以科学论文、技术报告、学术文献为信息来源的问答任务,要求系统理解专业领域语言、数值精度和跨节逻辑关系。
任务谱系
科学文献 QA 包含多个子任务:
| 子任务 | 代表性工作 | 特点 |
|---|---|---|
| 文献搜索式 QA | PaperQA2, SciMaster | 在外部文献库中搜索相关论文后回答 |
| 对比/综述问答 | PeerQA | 需要跨论文比较或论证 |
| 开放科学推理 | ScienceQA | 需要多步推理和领域知识 |
| 内容锚定检索 | **[[intraview | IntraView]]** |
核心挑战
- 领域语言鸿沟:查询术语(如"表面增强拉曼散射")与文献中使用的术语(如 SERS、纳米颗粒)可能完全不同
- 数值精度:实验参数(如"514.5 nm 激光")的提取需要精确匹配
- 跨节依赖:方法、结果、讨论之间需要交叉引用
- 图表信息:关键信息可能在图表而非文本中
评估策略演进
传统评估(BLEU/ROUGE)难以处理科学术语的同义词和缩写。intrabench 引入的 LLM 锚定多选题评估是一种进步——允许语义等价而非字面匹配。
相关概念
- intraview — 科学文献 QA 的一个严格的子任务
- intrabench — 首个多领域科学文献 QA 基准
- content-grounded-retrieval — 内容锚定作为评估的基础约束