Files
myWiki/concepts/recommendation-reasoning.md

1.7 KiB
Raw Blame History

title, created, updated, type, tags, sources
title created updated type tags sources
推荐推理 (Recommendation Reasoning) 2026-06-10 2026-06-10 concept
recommendation
reasoning
chain-of-thought
raw/papers/onereason-team-onereason-2026.md

推荐推理 (Recommendation Reasoning)

在推荐系统中引入「先思考再推荐」的推理范式,让模型在生成推荐结果前进行显式的逻辑推理。

核心挑战

与经典的数学/代码/符号逻辑推理不同,推荐推理具有三个独特性质:

  1. 多解性:推荐允许多个合理答案,非单一正确答案
  2. 意图不可观测:用户真实兴趣永远无法直接观测,只能从行为序列推断
  3. abductive-reasoning-recommendation推荐推理是溯因Abduction而非演绎Deduction——从行为反推隐含兴趣

推理 vs 非推理的意外发现

初步研究OneRec-Think、OpenOneRec发现 thinking mode 并不优于 non-thinking mode。OneReason 论文将此归因于两个缺失要素:

推荐 CoT 的理想结构

一个好的推荐 CoT 应该:

  1. 从行为序列中选择相关行为作为假设的兴趣点
  2. 将兴趣压缩为可解释的偏好
  3. 建模兴趣间的时间演化
  4. 将推断的偏好状态与推荐 item 关联

参考