SidneyZhang/myWiki

Files

Sidney Zhang b116710e4c

20260514:增加新内容

2026-05-14 13:54:52 +08:00

2.2 KiB

Raw Permalink Blame History

title, created, updated, type, tags, sources

title

created

updated

type

tags

sources

数学问题多维度改写

2026-05-12

2026-05-12

concept

data-augmentation

question-reformulation

mathematical-reasoning

arxiv:2601.20614

数学问题多维度改写

数学问题多维度改写 是 mqr 的核心策略，通过三个维度系统性地提高数学问题的内在难度，同时保持原始答案不变。

三种改写策略

1. Background（背景添加）

操作：添加与核心数学内容不相关但表面上与问题相关的叙事背景
背景主题：历史、文化、地理、自然、职业、日常生活、体育、艺术、科幻、冒险（明确排除天文学）
挑战：从噪声中识别关键数学信息的能力
约束：改写后问题不超过原题 100 词

2. Term（术语发明）

操作：发明一个新的抽象数学术语来定义问题的核心概念
要求：术语在问题中自然呈现，改写后问题自洽
挑战：理解抽象数学概念的能力

3. Sub-Problem（子问题嵌套）

操作：将原题中具有确定值的数值条件转化为独立子问题
子问题领域：代数、几何、数论、组合数学等任意数学分支
要求：子问题自洽、有唯一解、解恰好等于原题所需值
挑战：多步推理与跨域知识整合

质量保证

使用 OpenAI o3 评估改写后的数学等价性：

Background: 99%
Term: 97%
Sub-Problem: 97%

失败的改写意味着问题不可解或答案改变。但由于 RLVR 中答案空间极大且需要精确匹配，模型不可能偶然答对→所有响应全错→无梯度更新→无害。

与标准数据增强的区别

方法	策略	答案	难度
WizardMath	生成新 QA 对	质量难保证	不变
MuqleMath	查询+响应增强	需验证	不变
Variational Synthesis	变分再表述	需重新求解	可能变化
MQR	多维度改写	保持原答案	系统性提高

相关概念

mqr — 完整策略
mathforge — 框架
dgpo — 算法组件
dai-mathforge-2026