20260514:增加新内容
This commit is contained in:
56
concepts/math-question-reformulation.md
Normal file
56
concepts/math-question-reformulation.md
Normal file
@@ -0,0 +1,56 @@
|
||||
---
|
||||
title: "数学问题多维度改写"
|
||||
created: 2026-05-12
|
||||
updated: 2026-05-12
|
||||
type: concept
|
||||
tags: ["data-augmentation", "question-reformulation", "mathematical-reasoning"]
|
||||
sources: ["arxiv:2601.20614"]
|
||||
---
|
||||
|
||||
# 数学问题多维度改写
|
||||
|
||||
**数学问题多维度改写** 是 [[mqr|MQR]] 的核心策略,通过三个维度系统性地提高数学问题的内在难度,同时保持原始答案不变。
|
||||
|
||||
## 三种改写策略
|
||||
|
||||
### 1. Background(背景添加)
|
||||
- **操作**:添加与核心数学内容不相关但表面上与问题相关的叙事背景
|
||||
- **背景主题**:历史、文化、地理、自然、职业、日常生活、体育、艺术、科幻、冒险(明确排除天文学)
|
||||
- **挑战**:从噪声中识别关键数学信息的能力
|
||||
- **约束**:改写后问题不超过原题 100 词
|
||||
|
||||
### 2. Term(术语发明)
|
||||
- **操作**:发明一个新的抽象数学术语来定义问题的核心概念
|
||||
- **要求**:术语在问题中自然呈现,改写后问题自洽
|
||||
- **挑战**:理解抽象数学概念的能力
|
||||
|
||||
### 3. Sub-Problem(子问题嵌套)
|
||||
- **操作**:将原题中具有确定值的数值条件转化为独立子问题
|
||||
- **子问题领域**:代数、几何、数论、组合数学等任意数学分支
|
||||
- **要求**:子问题自洽、有唯一解、解恰好等于原题所需值
|
||||
- **挑战**:多步推理与跨域知识整合
|
||||
|
||||
## 质量保证
|
||||
|
||||
使用 OpenAI o3 评估改写后的数学等价性:
|
||||
- Background: 99%
|
||||
- Term: 97%
|
||||
- Sub-Problem: 97%
|
||||
|
||||
**失败的改写**意味着问题不可解或答案改变。但由于 RLVR 中答案空间极大且需要精确匹配,模型不可能偶然答对→所有响应全错→无梯度更新→**无害**。
|
||||
|
||||
## 与标准数据增强的区别
|
||||
|
||||
| 方法 | 策略 | 答案 | 难度 |
|
||||
|------|------|------|------|
|
||||
| WizardMath | 生成新 QA 对 | 质量难保证 | 不变 |
|
||||
| MuqleMath | 查询+响应增强 | 需验证 | 不变 |
|
||||
| Variational Synthesis | 变分再表述 | 需重新求解 | 可能变化 |
|
||||
| **MQR** | **多维度改写** | **保持原答案** | **系统性提高** |
|
||||
|
||||
## 相关概念
|
||||
|
||||
- [[mqr|MQR]] — 完整策略
|
||||
- [[mathforge]] — 框架
|
||||
- [[dgpo|DGPO]] — 算法组件
|
||||
- [[dai-mathforge-2026|论文页面]]
|
||||
Reference in New Issue
Block a user