1.6 KiB
1.6 KiB
title, created, updated, type, tags, sources
| title | created | updated | type | tags | sources | ||||
|---|---|---|---|---|---|---|---|---|---|
| 推荐思维链 (Recommendation CoT) | 2026-06-10 | 2026-06-10 | concept |
|
|
推荐思维链 (Recommendation CoT)
专门为推荐任务设计的 Chain-of-Thought 推理格式,区别于通用 LLM 的 CoT。
与通用 CoT 的区别
通用 chain-of-thought 面向数学/代码/逻辑等有唯一正确答案的任务。推荐 CoT 需要处理:
- 多解输出:多个 item 都可以是合理推荐
- 隐含意图:用户意图不可观测,需从 itemic-tokens 序列推断
- 时序演化:兴趣随时间变化,需建模长期/短期/周期偏好
OneReason 的三层 CoT 结构
OneReason 提出 cognition-enhanced CoT,包含三个层次:
R1: Derivation(推导)
从单个 item 语义推理 item-to-item 关系,通过常识或知识关联从噪声交互历史中提取潜在兴趣。
R2: Evolution(演化)
将同一潜在兴趣的 item 建模为时序过程,捕捉长期、短期和周期性偏好。
R3: Recommendation(推荐)
在所有服务域(短视频、直播等)中连贯推理,产出高质量推荐决策。
CoT 鲁棒性的两个条件
借鉴多模态 LLM 研究,推荐 CoT 的有效性依赖:
- itemic-text-alignment(感知层面)
- 粗到细的推理格式(认知层面)