Files
myWiki/concepts/differentiable-token-budgeting.md

45 lines
1.9 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

---
title: "Differentiable Token Budgeting"
created: 2026-06-05
updated: 2026-06-05
type: concept
tags: [token-economics, frontier, differentiable, agent]
sources: [[chen-token-economics-llm-agents]]
---
# Differentiable Token Budgeting
**可微分 Token 预算**是 Token Economics 五大前沿方向之一O1主张将 Token 预算从一个**外生参数**转变为一个**可学习的、可微分的参数**,使 Agent 能通过梯度优化自动学习最优的 Token 分配策略。
## 动机
当前的 Token 预算管理是硬编码的:
- 固定上下文窗口截断
- 手动设定的 CoT 步骤上限
- 静态的工具调用次数限制
这些硬约束忽略了任务间的异质性:简单任务被分配过多 token 造成浪费,复杂任务被截断导致失败。
## 核心理念
```
Budget = f_θ(task_complexity, quality_target, cost_constraint)
```
使用可学习的函数 f_θ参数为 θ),根据任务特征动态预测最优 Token 预算。通过将预算分配与最终任务质量建立可微连接,用梯度下降优化 θ。
## 关键挑战
| 挑战 | 描述 |
|------|------|
| **离散性** | Token 预算是离散的——需要离散优化或连续松弛 |
| **因果链长度** | 预算 → 生成 → 质量之间的因果链太长,梯度信号稀疏 |
| **分配粒度** | 预算需要在 token 类型之间分配(推理/记忆/工具),而非单一数字 |
| **在线适应** | 预算预测需要适应执行过程中的新信息 |
## 与相关概念的连接
- [[agent-token-budget-optimization|Token 预算优化]] 解决静态预算下的最优分配,可微预算解决预算本身的动态确定
- [[token-efficiency|Token 效率]] 的目标(更少 token 同等质量)是可微预算的优化信号
- [[micro-level-token-economics|微观 Token 经济学]] 的要素替代问题在可微预算下不再需要人工设定替代弹性