1.7 KiB
1.7 KiB
title, created, updated, type, tags, sources
| title | created | updated | type | tags | sources | ||||
|---|---|---|---|---|---|---|---|---|---|
| 推荐推理 (Recommendation Reasoning) | 2026-06-10 | 2026-06-10 | concept |
|
|
推荐推理 (Recommendation Reasoning)
在推荐系统中引入「先思考再推荐」的推理范式,让模型在生成推荐结果前进行显式的逻辑推理。
核心挑战
与经典的数学/代码/符号逻辑推理不同,推荐推理具有三个独特性质:
- 多解性:推荐允许多个合理答案,非单一正确答案
- 意图不可观测:用户真实兴趣永远无法直接观测,只能从行为序列推断
- abductive-reasoning-recommendation:推荐推理是溯因(Abduction)而非演绎(Deduction)——从行为反推隐含兴趣
推理 vs 非推理的意外发现
初步研究(OneRec-Think、OpenOneRec)发现 thinking mode 并不优于 non-thinking mode。OneReason 论文将此归因于两个缺失要素:
- perception-cognition-recommendation 不足:itemic token 缺乏语义 grounding
- perception-cognition-recommendation 不足:CoT 结构不适合推荐任务
推荐 CoT 的理想结构
一个好的推荐 CoT 应该:
- 从行为序列中选择相关行为作为假设的兴趣点
- 将兴趣压缩为可解释的偏好
- 建模兴趣间的时间演化
- 将推断的偏好状态与推荐 item 关联