1.3 KiB
1.3 KiB
title, created, updated, type, tags, sources
| title | created | updated | type | tags | sources | ||||
|---|---|---|---|---|---|---|---|---|---|
| Itemic Token | 2026-06-10 | 2026-06-10 | concept |
|
|
Itemic Token
生成式推荐中表示单个 item 的特殊 token,将推荐转化为序列生成任务的基础抽象单元。
定义
在 generative-recommendation 中,每个 item(商品、视频、直播等)被编码为一个特殊的 itemic token。整个用户行为历史被表示为 itemic token 序列,模型通过自回归生成下一个 token 来完成推荐。
核心特性
- 离散化表示:将连续 item embedding 离散化为有限词表中的 token
- 序列化交互:用户行为被扁平化为 token 序列,适用于 Transformer 自回归
- Scaling 兼容:与 LLM 的 token 机制同构,可复用 LLM 的训练基础设施
关键挑战
- 语义空洞:itemic token 本身不携带语言语义,模型只能学习表面转移模式
- CoT 构造障碍:无法仅用 itemic token 构造有意义的 chain-of-thought
- 感知鸿沟:需要 itemic-text-alignment 来为 token 注入语义