Files
myWiki/concepts/recommendation-cot.md

1.6 KiB
Raw Blame History

title, created, updated, type, tags, sources
title created updated type tags sources
推荐思维链 (Recommendation CoT) 2026-06-10 2026-06-10 concept
recommendation
chain-of-thought
reasoning
raw/papers/onereason-team-onereason-2026.md

推荐思维链 (Recommendation CoT)

专门为推荐任务设计的 Chain-of-Thought 推理格式,区别于通用 LLM 的 CoT。

与通用 CoT 的区别

通用 chain-of-thought 面向数学/代码/逻辑等有唯一正确答案的任务。推荐 CoT 需要处理:

  • 多解输出:多个 item 都可以是合理推荐
  • 隐含意图:用户意图不可观测,需从 itemic-tokens 序列推断
  • 时序演化:兴趣随时间变化,需建模长期/短期/周期偏好

OneReason 的三层 CoT 结构

OneReason 提出 cognition-enhanced CoT包含三个层次

R1: Derivation推导

从单个 item 语义推理 item-to-item 关系,通过常识或知识关联从噪声交互历史中提取潜在兴趣。

R2: Evolution演化

将同一潜在兴趣的 item 建模为时序过程,捕捉长期、短期和周期性偏好。

R3: Recommendation推荐

在所有服务域(短视频、直播等)中连贯推理,产出高质量推荐决策。

CoT 鲁棒性的两个条件

借鉴多模态 LLM 研究,推荐 CoT 的有效性依赖:

  1. itemic-text-alignment(感知层面)
  2. 粗到细的推理格式(认知层面)

参考