SidneyZhang/myWiki

Files

Sidney Zhang 6021dea160

20260625:很多新内容

2026-06-25 14:08:47 +08:00

1.4 KiB

Raw Blame History

title, created, updated, type, tags, sources

title

created

updated

type

tags

sources

过度思考 (Overthinking)

2026-06-18

2026-06-18

concept

reasoning

efficiency

cot

thinking

gan-thinking-based-non-thinking-2026

过度思考 (Overthinking)

Overthinking 指large-reasoning-models对所有查询（包括简单查询）都产生冗长、重复的chain-of-thought（CoT），导致推理开销和延迟大幅增加的问题（Sui et al., 2025; Qu et al., 2025）。

问题本质

LRM 的 CoT 包含持续的探索、反思和自我验证——这是它们在数学竞赛等复杂任务上成功的关键。但这种"不分难易一律思考"的策略导致：

推理时延：简单问题也经历完整的多步推理
Token 浪费：大量"Wait... Let me check..."等无建设性内容
计算成本：每个请求的 FLOPs 和内存消耗显著增加

与混合推理的关系

Overthinking 是hybrid-reasoning-models的核心动机——目标不是消除思考，而是让模型学会"简单问题直接答，复杂问题才思考"。

TNT 的解决方案

TNT 让模型自主选择思考/非思考模式，最终在数学基准上：

Token 使用量减少约 50%
准确率同时提升 4.1%
Reward hacking 率 < 10%

参考