Files
myWiki/concepts/runtime-interface-adaptation.md

2.0 KiB
Raw Blame History

title, created, updated, type, tags, sources, confidence
title created updated type tags sources confidence
Runtime Interface Adaptation运行时接口适配 2026-06-11 2026-06-11 concept
agent
adaptation
runtime
paradigm
raw/papers/xu-life-harness-runtime-adaptation-2026.md
high

Runtime Interface Adaptation

一种 Agent 改进范式:适配模型与环境的接口层而非模型参数本身。与 Parameter Adaptation 互补。

两种范式对比

维度 Parameter Adaptation Runtime Interface Adaptation
修改对象 模型权重 θ Harness H
模型状态 θ′ 改变 θ 冻结
适用性 模型/任务特定 环境特定,模型无关
复用成本 换模型需重新训练 同一环境可跨模型复用
典型方法 SFT / RL / Distill runtime-harness-adaptation
适配内容 推理能力、工具使用模式 工具契约、动作验证、轨迹调控

动机

在确定性、规则驱动的 Agent 领域(如 ALFWorld、τ-bench、AgentBench环境的规则结构是稳定且可显式建模的。将这些结构编码进模型权重是间接且高成本的做法;将它们暴露在 Runtime 接口层则更直接、更易维护、更可跨模型迁移。

Life-Harness 的实验表明:仅在 Qwen3-4B-Instruct 上训练的 harness 可直接提升其他 17 个模型的表现,平均相对增益 88.5%——这正是 Runtime Interface 适配的核心优势。

定位

Runtime Interface Adaptation 不是要取代 Parameter Adaptation而是作为互补范式

  • 模型变强Parameter Adaptation→ 更好的推理和决策
  • 接口变好Interface Adaptation→ 更少的协议错误和轨迹退化

两者叠加可获得最大收益——Life-Harness 同时提升了基础模型和工具微调模型。

参考