1.9 KiB
1.9 KiB
title, created, updated, type, tags, sources
| title | created | updated | type | tags | sources | ||||||
|---|---|---|---|---|---|---|---|---|---|---|---|
| Differentiable Token Budgeting | 2026-06-05 | 2026-06-05 | concept |
|
|
Differentiable Token Budgeting
可微分 Token 预算是 Token Economics 五大前沿方向之一(O1),主张将 Token 预算从一个外生参数转变为一个可学习的、可微分的参数,使 Agent 能通过梯度优化自动学习最优的 Token 分配策略。
动机
当前的 Token 预算管理是硬编码的:
- 固定上下文窗口截断
- 手动设定的 CoT 步骤上限
- 静态的工具调用次数限制
这些硬约束忽略了任务间的异质性:简单任务被分配过多 token 造成浪费,复杂任务被截断导致失败。
核心理念
Budget = f_θ(task_complexity, quality_target, cost_constraint)
使用可学习的函数 f_θ(参数为 θ),根据任务特征动态预测最优 Token 预算。通过将预算分配与最终任务质量建立可微连接,用梯度下降优化 θ。
关键挑战
| 挑战 | 描述 |
|---|---|
| 离散性 | Token 预算是离散的——需要离散优化或连续松弛 |
| 因果链长度 | 预算 → 生成 → 质量之间的因果链太长,梯度信号稀疏 |
| 分配粒度 | 预算需要在 token 类型之间分配(推理/记忆/工具),而非单一数字 |
| 在线适应 | 预算预测需要适应执行过程中的新信息 |
与相关概念的连接
- agent-token-budget-optimization 解决静态预算下的最优分配,可微预算解决预算本身的动态确定
- token-efficiency 的目标(更少 token 同等质量)是可微预算的优化信号
- micro-level-token-economics 的要素替代问题在可微预算下不再需要人工设定替代弹性