Files
myWiki/concepts/scientific-literature-qa.md

1.7 KiB
Raw Blame History

title, type, created, tags, sources
title type created tags sources
Scientific Literature QA — Question Answering over Research Papers concept 2026-06-04
scientific-literature
question-answering
information-retrieval
ma-intragent-2026

Scientific Literature QA科学文献问答

定义:以科学论文、技术报告、学术文献为信息来源的问答任务,要求系统理解专业领域语言、数值精度和跨节逻辑关系。

任务谱系

科学文献 QA 包含多个子任务:

子任务 代表性工作 特点
文献搜索式 QA PaperQA2, SciMaster 在外部文献库中搜索相关论文后回答
对比/综述问答 PeerQA 需要跨论文比较或论证
开放科学推理 ScienceQA 需要多步推理和领域知识
内容锚定检索 **[[intraview IntraView]]**

核心挑战

  1. 领域语言鸿沟:查询术语(如"表面增强拉曼散射")与文献中使用的术语(如 SERS、纳米颗粒可能完全不同
  2. 数值精度:实验参数(如"514.5 nm 激光")的提取需要精确匹配
  3. 跨节依赖:方法、结果、讨论之间需要交叉引用
  4. 图表信息:关键信息可能在图表而非文本中

评估策略演进

传统评估BLEU/ROUGE难以处理科学术语的同义词和缩写。intrabench 引入的 LLM 锚定多选题评估是一种进步——允许语义等价而非字面匹配。

相关概念