20260617:目前有914 页
This commit is contained in:
43
concepts/runtime-interface-adaptation.md
Normal file
43
concepts/runtime-interface-adaptation.md
Normal file
@@ -0,0 +1,43 @@
|
||||
---
|
||||
title: "Runtime Interface Adaptation(运行时接口适配)"
|
||||
created: 2026-06-11
|
||||
updated: 2026-06-11
|
||||
type: concept
|
||||
tags: [agent, adaptation, runtime, paradigm]
|
||||
sources: [raw/papers/xu-life-harness-runtime-adaptation-2026.md]
|
||||
confidence: high
|
||||
---
|
||||
|
||||
# Runtime Interface Adaptation
|
||||
|
||||
> 一种 Agent 改进范式:适配模型与环境的**接口层**而非模型参数本身。与 Parameter Adaptation 互补。
|
||||
|
||||
## 两种范式对比
|
||||
|
||||
| 维度 | Parameter Adaptation | Runtime Interface Adaptation |
|
||||
|------|---------------------|------------------------------|
|
||||
| 修改对象 | 模型权重 θ | Harness H |
|
||||
| 模型状态 | θ′ 改变 | θ 冻结 |
|
||||
| 适用性 | 模型/任务特定 | 环境特定,模型无关 |
|
||||
| 复用成本 | 换模型需重新训练 | 同一环境可跨模型复用 |
|
||||
| 典型方法 | SFT / RL / Distill | [[runtime-harness-adaptation\|Life-Harness]] |
|
||||
| 适配内容 | 推理能力、工具使用模式 | 工具契约、动作验证、轨迹调控 |
|
||||
|
||||
## 动机
|
||||
|
||||
在确定性、规则驱动的 Agent 领域(如 ALFWorld、τ-bench、AgentBench),环境的规则结构是**稳定且可显式建模的**。将这些结构编码进模型权重是间接且高成本的做法;将它们暴露在 Runtime 接口层则更直接、更易维护、更可跨模型迁移。
|
||||
|
||||
Life-Harness 的实验表明:仅在 Qwen3-4B-Instruct 上训练的 harness 可直接提升其他 17 个模型的表现,平均相对增益 88.5%——这正是 Runtime Interface 适配的核心优势。
|
||||
|
||||
## 定位
|
||||
|
||||
Runtime Interface Adaptation 不是要取代 Parameter Adaptation,而是作为**互补范式**:
|
||||
- 模型变强(Parameter Adaptation)→ 更好的推理和决策
|
||||
- 接口变好(Interface Adaptation)→ 更少的协议错误和轨迹退化
|
||||
|
||||
两者叠加可获得最大收益——Life-Harness 同时提升了基础模型和工具微调模型。
|
||||
|
||||
## 参考
|
||||
- [[xu-life-harness|Life-Harness 论文]]
|
||||
- [[runtime-harness-adaptation|Runtime Harness Adaptation]]
|
||||
- [[agent-harness-engineering|Agent Harness Engineering]]
|
||||
Reference in New Issue
Block a user