Files
myWiki/concepts/math-question-reformulation.md

57 lines
2.2 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

---
title: "数学问题多维度改写"
created: 2026-05-12
updated: 2026-05-12
type: concept
tags: ["data-augmentation", "question-reformulation", "mathematical-reasoning"]
sources: ["arxiv:2601.20614"]
---
# 数学问题多维度改写
**数学问题多维度改写** 是 [[mqr|MQR]] 的核心策略,通过三个维度系统性地提高数学问题的内在难度,同时保持原始答案不变。
## 三种改写策略
### 1. Background背景添加
- **操作**:添加与核心数学内容不相关但表面上与问题相关的叙事背景
- **背景主题**:历史、文化、地理、自然、职业、日常生活、体育、艺术、科幻、冒险(明确排除天文学)
- **挑战**:从噪声中识别关键数学信息的能力
- **约束**:改写后问题不超过原题 100 词
### 2. Term术语发明
- **操作**:发明一个新的抽象数学术语来定义问题的核心概念
- **要求**:术语在问题中自然呈现,改写后问题自洽
- **挑战**:理解抽象数学概念的能力
### 3. Sub-Problem子问题嵌套
- **操作**:将原题中具有确定值的数值条件转化为独立子问题
- **子问题领域**:代数、几何、数论、组合数学等任意数学分支
- **要求**:子问题自洽、有唯一解、解恰好等于原题所需值
- **挑战**:多步推理与跨域知识整合
## 质量保证
使用 OpenAI o3 评估改写后的数学等价性:
- Background: 99%
- Term: 97%
- Sub-Problem: 97%
**失败的改写**意味着问题不可解或答案改变。但由于 RLVR 中答案空间极大且需要精确匹配,模型不可能偶然答对→所有响应全错→无梯度更新→**无害**
## 与标准数据增强的区别
| 方法 | 策略 | 答案 | 难度 |
|------|------|------|------|
| WizardMath | 生成新 QA 对 | 质量难保证 | 不变 |
| MuqleMath | 查询+响应增强 | 需验证 | 不变 |
| Variational Synthesis | 变分再表述 | 需重新求解 | 可能变化 |
| **MQR** | **多维度改写** | **保持原答案** | **系统性提高** |
## 相关概念
- [[mqr|MQR]] — 完整策略
- [[mathforge]] — 框架
- [[dgpo|DGPO]] — 算法组件
- [[dai-mathforge-2026|论文页面]]