Files
myWiki/concepts/held-out-validation-gate.md
2026-06-01 10:46:01 +08:00

1.4 KiB
Raw Blame History

title, created, updated, type, tags, sources
title created updated type tags sources
Held-Out Validation Gate (留出验证门) 2026-05-29 2026-05-29 concept
optimization
validation
skill
gate
https://arxiv.org/abs/2605.23904

Held-Out Validation Gate (留出验证门)

Held-Out Validation Gateskillopt 中的关键安全机制:每个候选 skill 编辑必须在留出的验证集上通过评估,只有在严格改善时才被接受。它是深度学习中 validation-based model selection 在文本空间的对应。

工作流程

Candidate Skill → 在 D_sel 上评估 → 
  改善?→ Accept → 可能成为 best_skill.md
  未改善?→ [[rejected-edit-buffer|Reject → buffer]]

为什么至关重要

LLM 可以生成"看起来合理"的编辑但实际上会降低目标模型的表现。Validation gate 将反思reflection转变为提出-验证型优化propose-and-test而非无条件地自编辑。

双重判断

  • Improvement over current: 候选 skill 是否比当前 skill 更好?
  • All-time best: 是否超过历史最佳?→ 更新 best_skill.md

与深度学习的类比

深度学习: 在 val set 上选最佳 checkpoint
SkillOpt:  在 D_sel 上 gate 每个 skill edit

相关