20260625:很多新内容
This commit is contained in:
41
concepts/temperature-sampling.md
Normal file
41
concepts/temperature-sampling.md
Normal file
@@ -0,0 +1,41 @@
|
||||
---
|
||||
title: "温度采样(Temperature Sampling)"
|
||||
created: 2026-06-21
|
||||
updated: 2026-06-21
|
||||
type: concept
|
||||
tags:
|
||||
- sampling
|
||||
- decoding
|
||||
- diversity
|
||||
- spiral-of-silence
|
||||
sources:
|
||||
- data派THU 2026
|
||||
---
|
||||
|
||||
# 温度采样(Temperature Sampling)
|
||||
|
||||
LLM 解码阶段的关键参数,通过调整 softmax 分布的锐度来控制输出的随机性。温度 T 越高,输出分布越平滑,低概率 token 被选中的概率越大。
|
||||
|
||||
## 在沉默螺旋治理中的应用
|
||||
|
||||
温度采样是打破 AI 沉默螺旋的**技术层治理手段**之一:
|
||||
|
||||
- **低温度(T < 1.0)**:输出高度确定,总是选择高概率 token → **放大沉默螺旋**
|
||||
- **高温度(T > 1.0)**:输出更随机,小众 token 更可能被选中 → **缓解沉默螺旋**
|
||||
- **top-p / top-k 联合采样**:在保留多样性的同时避免输出质量失控
|
||||
|
||||
## 权衡
|
||||
|
||||
高温度采样的代价是可能引入更多噪声、降低输出质量。需要在**多样性 vs 质量**之间寻找平衡点。这是 [[rlhf-alignment-amplification|RLHF 对齐放大]] 问题的镜像——RLHF 压低熵增加安全性但降低多样性,温度采样抬高熵增加多样性但可能降低质量。
|
||||
|
||||
## 治理建议
|
||||
|
||||
- 对小模型适配更高温度(因其统计偏好更强)
|
||||
- 结合 top-p 截断防止极端噪声
|
||||
- 多候选择优时加入多样性奖励机制
|
||||
|
||||
## 参考
|
||||
|
||||
- [[content-diversity-decay|内容多样性衰减]]
|
||||
- [[pretraining-statistical-bias|预训练统计偏好]]
|
||||
- [[llm-spiral-of-silence-2026|LLM 沉默螺旋]]
|
||||
Reference in New Issue
Block a user