Files
myWiki/concepts/synthetic-data.md

771 B
Raw Blame History

title, created, updated, type, tags, status
title created updated type tags status
合成数据 (Synthetic Data) 2026-06-03 2026-06-03 concept
synthetic-data
training
data-generation
placeholder

合成数据 (Synthetic Data)

⚠️ 占位符页面 — 待完善

合成数据是通过算法或模型生成的人工数据,用于增强或替代真实训练数据。在 LLM 训练中广泛用于:

  • 问题生成:如 mathchatsync-reasoning 的多轮推理数据合成
  • 指令数据GPT-4 等强模型生成指令-响应对
  • 数据扩充:弥补真实数据不足的领域

相关概念