20260617:目前有914 页
This commit is contained in:
35
concepts/itemic-tokens.md
Normal file
35
concepts/itemic-tokens.md
Normal file
@@ -0,0 +1,35 @@
|
||||
---
|
||||
title: "Itemic Token"
|
||||
created: 2026-06-10
|
||||
updated: 2026-06-10
|
||||
type: concept
|
||||
tags: [recommendation, tokenization, generative-model]
|
||||
sources: [raw/papers/onereason-team-onereason-2026.md]
|
||||
---
|
||||
|
||||
# Itemic Token
|
||||
|
||||
> 生成式推荐中表示单个 item 的特殊 token,将推荐转化为序列生成任务的基础抽象单元。
|
||||
|
||||
## 定义
|
||||
|
||||
在 [[generative-recommendation|生成式推荐]] 中,每个 item(商品、视频、直播等)被编码为一个特殊的 itemic token。整个用户行为历史被表示为 itemic token 序列,模型通过自回归生成下一个 token 来完成推荐。
|
||||
|
||||
## 核心特性
|
||||
|
||||
- **离散化表示**:将连续 item embedding 离散化为有限词表中的 token
|
||||
- **序列化交互**:用户行为被扁平化为 token 序列,适用于 Transformer 自回归
|
||||
- **Scaling 兼容**:与 LLM 的 token 机制同构,可复用 LLM 的训练基础设施
|
||||
|
||||
## 关键挑战
|
||||
|
||||
- **语义空洞**:itemic token 本身不携带语言语义,模型只能学习表面转移模式
|
||||
- **CoT 构造障碍**:无法仅用 itemic token 构造有意义的 [[chain-of-thought|思维链]]
|
||||
- **感知鸿沟**:需要 [[itemic-text-alignment|itemic-text 对齐]] 来为 token 注入语义
|
||||
|
||||
## 参考
|
||||
|
||||
- [[onerec|OneRec]]
|
||||
- [[generative-recommendation|生成式推荐]]
|
||||
- [[itemic-text-alignment|Itemic-Text 对齐]]
|
||||
- [[onereason|OneReason]]
|
||||
Reference in New Issue
Block a user