45 lines
1.9 KiB
Markdown
45 lines
1.9 KiB
Markdown
---
|
||
title: "Differentiable Token Budgeting"
|
||
created: 2026-06-05
|
||
updated: 2026-06-05
|
||
type: concept
|
||
tags: [token-economics, frontier, differentiable, agent]
|
||
sources: [[chen-token-economics-llm-agents]]
|
||
---
|
||
|
||
# Differentiable Token Budgeting
|
||
|
||
**可微分 Token 预算**是 Token Economics 五大前沿方向之一(O1),主张将 Token 预算从一个**外生参数**转变为一个**可学习的、可微分的参数**,使 Agent 能通过梯度优化自动学习最优的 Token 分配策略。
|
||
|
||
## 动机
|
||
|
||
当前的 Token 预算管理是硬编码的:
|
||
- 固定上下文窗口截断
|
||
- 手动设定的 CoT 步骤上限
|
||
- 静态的工具调用次数限制
|
||
|
||
这些硬约束忽略了任务间的异质性:简单任务被分配过多 token 造成浪费,复杂任务被截断导致失败。
|
||
|
||
## 核心理念
|
||
|
||
```
|
||
Budget = f_θ(task_complexity, quality_target, cost_constraint)
|
||
```
|
||
|
||
使用可学习的函数 f_θ(参数为 θ),根据任务特征动态预测最优 Token 预算。通过将预算分配与最终任务质量建立可微连接,用梯度下降优化 θ。
|
||
|
||
## 关键挑战
|
||
|
||
| 挑战 | 描述 |
|
||
|------|------|
|
||
| **离散性** | Token 预算是离散的——需要离散优化或连续松弛 |
|
||
| **因果链长度** | 预算 → 生成 → 质量之间的因果链太长,梯度信号稀疏 |
|
||
| **分配粒度** | 预算需要在 token 类型之间分配(推理/记忆/工具),而非单一数字 |
|
||
| **在线适应** | 预算预测需要适应执行过程中的新信息 |
|
||
|
||
## 与相关概念的连接
|
||
|
||
- [[agent-token-budget-optimization|Token 预算优化]] 解决静态预算下的最优分配,可微预算解决预算本身的动态确定
|
||
- [[token-efficiency|Token 效率]] 的目标(更少 token 同等质量)是可微预算的优化信号
|
||
- [[micro-level-token-economics|微观 Token 经济学]] 的要素替代问题在可微预算下不再需要人工设定替代弹性
|