Skill Data Flywheel (Skill 数据飞轮)

Skill Data Flywheel 是吕明在 SkillOpt 深度解读中识别的正向反馈循环：Skill 自进化过程中产生的高质量轨迹数据，可以反哺模型层的持续学习，形成飞轮效应。

飞轮结构

更好的 Skill → 更好的 Agent 执行轨迹 →
更高质量的训练数据 → 更强的 Model →
更好的 Optimizer 分析 → 更好的 Skill →
...

SkillOpt 框架运行中自然产生的训练数据：

MetaClaw 的双循环机制中，Opportunistic Policy Optimization 正是利用 Skill 进化产生的更高质量轨迹进行 RL-PRM 训练。

飞轮在企业私有化部署中的特殊价值：所有数据（Skill 优化轨迹、验证集、编辑决策）都保留在企业内部，形成 具有竞争壁垒的自进化能力。