20260617:目前有914 页
This commit is contained in:
44
concepts/differentiable-token-budgeting.md
Normal file
44
concepts/differentiable-token-budgeting.md
Normal file
@@ -0,0 +1,44 @@
|
||||
---
|
||||
title: "Differentiable Token Budgeting"
|
||||
created: 2026-06-05
|
||||
updated: 2026-06-05
|
||||
type: concept
|
||||
tags: [token-economics, frontier, differentiable, agent]
|
||||
sources: [[chen-token-economics-llm-agents]]
|
||||
---
|
||||
|
||||
# Differentiable Token Budgeting
|
||||
|
||||
**可微分 Token 预算**是 Token Economics 五大前沿方向之一(O1),主张将 Token 预算从一个**外生参数**转变为一个**可学习的、可微分的参数**,使 Agent 能通过梯度优化自动学习最优的 Token 分配策略。
|
||||
|
||||
## 动机
|
||||
|
||||
当前的 Token 预算管理是硬编码的:
|
||||
- 固定上下文窗口截断
|
||||
- 手动设定的 CoT 步骤上限
|
||||
- 静态的工具调用次数限制
|
||||
|
||||
这些硬约束忽略了任务间的异质性:简单任务被分配过多 token 造成浪费,复杂任务被截断导致失败。
|
||||
|
||||
## 核心理念
|
||||
|
||||
```
|
||||
Budget = f_θ(task_complexity, quality_target, cost_constraint)
|
||||
```
|
||||
|
||||
使用可学习的函数 f_θ(参数为 θ),根据任务特征动态预测最优 Token 预算。通过将预算分配与最终任务质量建立可微连接,用梯度下降优化 θ。
|
||||
|
||||
## 关键挑战
|
||||
|
||||
| 挑战 | 描述 |
|
||||
|------|------|
|
||||
| **离散性** | Token 预算是离散的——需要离散优化或连续松弛 |
|
||||
| **因果链长度** | 预算 → 生成 → 质量之间的因果链太长,梯度信号稀疏 |
|
||||
| **分配粒度** | 预算需要在 token 类型之间分配(推理/记忆/工具),而非单一数字 |
|
||||
| **在线适应** | 预算预测需要适应执行过程中的新信息 |
|
||||
|
||||
## 与相关概念的连接
|
||||
|
||||
- [[agent-token-budget-optimization|Token 预算优化]] 解决静态预算下的最优分配,可微预算解决预算本身的动态确定
|
||||
- [[token-efficiency|Token 效率]] 的目标(更少 token 同等质量)是可微预算的优化信号
|
||||
- [[micro-level-token-economics|微观 Token 经济学]] 的要素替代问题在可微预算下不再需要人工设定替代弹性
|
||||
Reference in New Issue
Block a user