1.4 KiB
1.4 KiB
title, created, updated, type, tags, sources
| title | created | updated | type | tags | sources | |||||
|---|---|---|---|---|---|---|---|---|---|---|
| 过度思考 (Overthinking) | 2026-06-18 | 2026-06-18 | concept |
|
|
过度思考 (Overthinking)
Overthinking 指large-reasoning-models对所有查询(包括简单查询)都产生冗长、重复的chain-of-thought(CoT),导致推理开销和延迟大幅增加的问题(Sui et al., 2025; Qu et al., 2025)。
问题本质
LRM 的 CoT 包含持续的探索、反思和自我验证——这是它们在数学竞赛等复杂任务上成功的关键。但这种"不分难易一律思考"的策略导致:
- 推理时延:简单问题也经历完整的多步推理
- Token 浪费:大量"Wait... Let me check..."等无建设性内容
- 计算成本:每个请求的 FLOPs 和内存消耗显著增加
与混合推理的关系
Overthinking 是hybrid-reasoning-models的核心动机——目标不是消除思考,而是让模型学会"简单问题直接答,复杂问题才思考"。
TNT 的解决方案
TNT 让模型自主选择思考/非思考模式,最终在数学基准上:
- Token 使用量减少约 50%
- 准确率同时提升 4.1%
- Reward hacking 率 < 10%