Files
myWiki/concepts/confidence-correctness-alignment.md

743 B

title, created, updated, type, tags, sources
title created updated type tags sources
置信度-正确性对齐 (Confidence-Correctness Alignment) 2025-04-15 2026-05-01 concept

置信度-正确性对齐 (Confidence-Correctness Alignment)

模型初始置信度与实际正确性的一致程度,是决定 intrinsic-rewards-sharpening 成败的关键变量。

二分命运

  • 对齐: 锐化 → 放大正确推理路径 → 性能提升
  • 错位: 锐化 → 系统性放大错误 → 模型崩溃

对齐强度可通过 model-collapse-step 量化。

相关概念