20260617:目前有914 页

2026-06-17 15:02:40 +08:00
parent e96b955fda
commit 91fac5b6fc
423 changed files with 20687 additions and 34 deletions
--- a/concepts/differentiable-token-budgeting.md
+++ b/concepts/differentiable-token-budgeting.md
@@ -0,0 +1,44 @@
+---
+title: "Differentiable Token Budgeting"
+created: 2026-06-05
+updated: 2026-06-05
+type: concept
+tags: [token-economics, frontier, differentiable, agent]
+sources: [[chen-token-economics-llm-agents]]
+---
+
+# Differentiable Token Budgeting
+
+**可微分 Token 预算**是 Token Economics 五大前沿方向之一（O1），主张将 Token 预算从一个**外生参数**转变为一个**可学习的、可微分的参数**，使 Agent 能通过梯度优化自动学习最优的 Token 分配策略。
+
+## 动机
+
+当前的 Token 预算管理是硬编码的：
+- 固定上下文窗口截断
+- 手动设定的 CoT 步骤上限
+- 静态的工具调用次数限制
+
+这些硬约束忽略了任务间的异质性：简单任务被分配过多 token 造成浪费，复杂任务被截断导致失败。
+
+## 核心理念
+
+```
+Budget = f_θ(task_complexity, quality_target, cost_constraint)
+```
+
+使用可学习的函数 f_θ（参数为 θ），根据任务特征动态预测最优 Token 预算。通过将预算分配与最终任务质量建立可微连接，用梯度下降优化 θ。
+
+## 关键挑战
+
+| 挑战 | 描述 |
+|------|------|
+| **离散性** | Token 预算是离散的——需要离散优化或连续松弛 |
+| **因果链长度** | 预算 → 生成 → 质量之间的因果链太长，梯度信号稀疏 |
+| **分配粒度** | 预算需要在 token 类型之间分配（推理/记忆/工具），而非单一数字 |
+| **在线适应** | 预算预测需要适应执行过程中的新信息 |
+
+## 与相关概念的连接
+
+- [[agent-token-budget-optimization|Token 预算优化]] 解决静态预算下的最优分配，可微预算解决预算本身的动态确定
+- [[token-efficiency|Token 效率]] 的目标（更少 token 同等质量）是可微预算的优化信号
+- [[micro-level-token-economics|微观 Token 经济学]] 的要素替代问题在可微预算下不再需要人工设定替代弹性