Files
myWiki/concepts/micro-level-token-economics.md

46 lines
1.9 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

---
title: "Micro-Level Token Economics"
created: 2026-06-05
updated: 2026-06-05
type: concept
tags: [token-economics, single-agent, efficiency]
sources: [[chen-token-economics-llm-agents]]
---
# Micro-Level Token Economics
**微观 Token 经济学**是 Token Economics 四维分类法中的第一层,关注**单个 Agent 的 Token 资源配置**问题。理论基础新古典企业理论Neoclassical Theory of the Firm和要素替代理论Factor Substitution
## 核心公式
```
min TC = Σ(token_i × price_i) s.t. Quality ≥ Z
```
在满足输出质量阈值 Z 的前提下,最小化总 Token 消耗成本。这本质上是带约束的生产要素组合优化问题。
## 五维要素
| 要素 | 对应模块 | 优化方向 |
|------|---------|---------|
| **推理 Token** | Planning & Reasoning | CoT 压缩、推理步骤精简 |
| **计算 Token** | Inference | KV-cache 共享、投机解码 |
| **记忆 Token** | Context & Memory | 压缩、摘要、检索替代存储 |
| **工具 Token** | Tool Use & Retrieval | 精准调用、批量操作 |
| **框架 Token** | Agent Framework | 减少框架级元数据开销 |
## 要素替代关系
关键经济洞见:不同 token 类型之间存在**替代弹性**
- 推理 vs 记忆:更多推理步骤可以减少需要保留的上下文(少存多想)
- 工具 vs 记忆:更多工具调用可以减少需要记忆的信息(及时查询不存)
- 推理 vs 工具:更精准的查询可以避免冗长的推理
最优组合取决于要素的相对"价格"(不同 token 类型的单位成本因模型和硬件而异)。
## 与已有概念
- [[token-efficiency|Token 效率]] 专注视觉 token 压缩,属于计算 Token 的子类
- [[cost-quality-speed-trilemma|三元悖论]] 给出了多目标约束的边界
- [[agent-token-budget-optimization|预算优化]] 是此层的具体方法论