2.0 KiB
2.0 KiB
title, created, updated, type, tags, sources, confidence
| title | created | updated | type | tags | sources | confidence | |||||
|---|---|---|---|---|---|---|---|---|---|---|---|
| Runtime Interface Adaptation(运行时接口适配) | 2026-06-11 | 2026-06-11 | concept |
|
|
high |
Runtime Interface Adaptation
一种 Agent 改进范式:适配模型与环境的接口层而非模型参数本身。与 Parameter Adaptation 互补。
两种范式对比
| 维度 | Parameter Adaptation | Runtime Interface Adaptation |
|---|---|---|
| 修改对象 | 模型权重 θ | Harness H |
| 模型状态 | θ′ 改变 | θ 冻结 |
| 适用性 | 模型/任务特定 | 环境特定,模型无关 |
| 复用成本 | 换模型需重新训练 | 同一环境可跨模型复用 |
| 典型方法 | SFT / RL / Distill | runtime-harness-adaptation |
| 适配内容 | 推理能力、工具使用模式 | 工具契约、动作验证、轨迹调控 |
动机
在确定性、规则驱动的 Agent 领域(如 ALFWorld、τ-bench、AgentBench),环境的规则结构是稳定且可显式建模的。将这些结构编码进模型权重是间接且高成本的做法;将它们暴露在 Runtime 接口层则更直接、更易维护、更可跨模型迁移。
Life-Harness 的实验表明:仅在 Qwen3-4B-Instruct 上训练的 harness 可直接提升其他 17 个模型的表现,平均相对增益 88.5%——这正是 Runtime Interface 适配的核心优势。
定位
Runtime Interface Adaptation 不是要取代 Parameter Adaptation,而是作为互补范式:
- 模型变强(Parameter Adaptation)→ 更好的推理和决策
- 接口变好(Interface Adaptation)→ 更少的协议错误和轨迹退化
两者叠加可获得最大收益——Life-Harness 同时提升了基础模型和工具微调模型。