20260625:很多新内容

2026-06-25 14:08:47 +08:00
parent 91fac5b6fc
commit 6021dea160
375 changed files with 19263 additions and 251 deletions
--- a/concepts/rlhf.md
+++ b/concepts/rlhf.md
@@ -15,7 +15,13 @@ RLHF 是一种基于人类反馈的强化学习对齐方法，是 SFT 的主要

 与 SFT 的对比是 [[zhang-reconciling-sft-interaction-2026|Zhang et al. (2026)]] 讨论的重要背景。

+## 沉默螺旋维度
+
+RLHF 对齐训练为规避风险而压低 token 预测熵值，会压缩模型的创作空间——这是 [[rlhf-alignment-amplification|RLHF 对齐放大]] 效应的核心，已被证实是 [[llm-spiral-of-silence-2026|LLM 沉默螺旋]] 的四大技术根源之一。
+
 ## 相关概念

 - [[supervised-fine-tuning|SFT]]
 - [[dpo]]
+- [[rlhf-alignment-amplification|RLHF 对齐放大]]
+- [[llm-spiral-of-silence-2026|LLM 沉默螺旋]]