推荐推理 (Recommendation Reasoning)

在推荐系统中引入「先思考再推荐」的推理范式，让模型在生成推荐结果前进行显式的逻辑推理。

核心挑战

与经典的数学/代码/符号逻辑推理不同，推荐推理具有三个独特性质：

多解性：推荐允许多个合理答案，非单一正确答案
意图不可观测：用户真实兴趣永远无法直接观测，只能从行为序列推断
abductive-reasoning-recommendation：推荐推理是溯因（Abduction）而非演绎（Deduction）——从行为反推隐含兴趣

初步研究（OneRec-Think、OpenOneRec）发现 thinking mode 并不优于 non-thinking mode。OneReason 论文将此归因于两个缺失要素：