771 B
771 B
title, created, updated, type, tags, status
| title | created | updated | type | tags | status | |||
|---|---|---|---|---|---|---|---|---|
| 合成数据 (Synthetic Data) | 2026-06-03 | 2026-06-03 | concept |
|
placeholder |
合成数据 (Synthetic Data)
⚠️ 占位符页面 — 待完善
合成数据是通过算法或模型生成的人工数据,用于增强或替代真实训练数据。在 LLM 训练中广泛用于:
- 问题生成:如 mathchatsync-reasoning 的多轮推理数据合成
- 指令数据:GPT-4 等强模型生成指令-响应对
- 数据扩充:弥补真实数据不足的领域