Files
myWiki/concepts/temperature-sampling.md

1.5 KiB
Raw Blame History

title, created, updated, type, tags, sources
title created updated type tags sources
温度采样Temperature Sampling 2026-06-21 2026-06-21 concept
sampling
decoding
diversity
spiral-of-silence
data派THU 2026

温度采样Temperature Sampling

LLM 解码阶段的关键参数,通过调整 softmax 分布的锐度来控制输出的随机性。温度 T 越高,输出分布越平滑,低概率 token 被选中的概率越大。

在沉默螺旋治理中的应用

温度采样是打破 AI 沉默螺旋的技术层治理手段之一:

  • 低温度T < 1.0:输出高度确定,总是选择高概率 token → 放大沉默螺旋
  • 高温度T > 1.0:输出更随机,小众 token 更可能被选中 → 缓解沉默螺旋
  • top-p / top-k 联合采样:在保留多样性的同时避免输出质量失控

权衡

高温度采样的代价是可能引入更多噪声、降低输出质量。需要在多样性 vs 质量之间寻找平衡点。这是 rlhf-alignment-amplification 问题的镜像——RLHF 压低熵增加安全性但降低多样性,温度采样抬高熵增加多样性但可能降低质量。

治理建议

  • 对小模型适配更高温度(因其统计偏好更强)
  • 结合 top-p 截断防止极端噪声
  • 多候选择优时加入多样性奖励机制

参考