Files
myWiki/concepts/math-question-reformulation.md

2.2 KiB
Raw Permalink Blame History

title, created, updated, type, tags, sources
title created updated type tags sources
数学问题多维度改写 2026-05-12 2026-05-12 concept
data-augmentation
question-reformulation
mathematical-reasoning
arxiv:2601.20614

数学问题多维度改写

数学问题多维度改写mqr 的核心策略,通过三个维度系统性地提高数学问题的内在难度,同时保持原始答案不变。

三种改写策略

1. Background背景添加

  • 操作:添加与核心数学内容不相关但表面上与问题相关的叙事背景
  • 背景主题:历史、文化、地理、自然、职业、日常生活、体育、艺术、科幻、冒险(明确排除天文学)
  • 挑战:从噪声中识别关键数学信息的能力
  • 约束:改写后问题不超过原题 100 词

2. Term术语发明

  • 操作:发明一个新的抽象数学术语来定义问题的核心概念
  • 要求:术语在问题中自然呈现,改写后问题自洽
  • 挑战:理解抽象数学概念的能力

3. Sub-Problem子问题嵌套

  • 操作:将原题中具有确定值的数值条件转化为独立子问题
  • 子问题领域:代数、几何、数论、组合数学等任意数学分支
  • 要求:子问题自洽、有唯一解、解恰好等于原题所需值
  • 挑战:多步推理与跨域知识整合

质量保证

使用 OpenAI o3 评估改写后的数学等价性:

  • Background: 99%
  • Term: 97%
  • Sub-Problem: 97%

失败的改写意味着问题不可解或答案改变。但由于 RLVR 中答案空间极大且需要精确匹配,模型不可能偶然答对→所有响应全错→无梯度更新→无害

与标准数据增强的区别

方法 策略 答案 难度
WizardMath 生成新 QA 对 质量难保证 不变
MuqleMath 查询+响应增强 需验证 不变
Variational Synthesis 变分再表述 需重新求解 可能变化
MQR 多维度改写 保持原答案 系统性提高

相关概念