Files
myWiki/concepts/cross-model-harness-transfer.md

1.8 KiB
Raw Blame History

title, created, updated, type, tags, sources, confidence
title created updated type tags sources confidence
Cross-Model Harness Transfer跨模型 Harness 迁移) 2026-06-11 2026-06-11 concept
agent
harness
transfer
generalization
raw/papers/xu-life-harness-runtime-adaptation-2026.md
high

Cross-Model Harness Transfer

在一个模型上进化出的 Runtime Harness直接复用于其他模型架构——无需重新训练或适配。

核心发现

Life-Harness 的实验揭示了一个关键性质:

  • 源模型:仅在 Qwen3-4B-Instruct 上进化 Harness
  • 目标17 个其他模型指令微调、推理、Agent 专用模型)
  • 结果116/126 模型-环境组合设臵提升,平均相对增益 88.5%

Harness 跨模型有效,因为它捕获的是环境侧的可复用结构(工具契约、合法动作集、退化模式),而非模型侧的行为特征

为什么能跨模型迁移

确定性 Agent 环境的"规则"与模型无关:

  • Tool Schema 对 Qwen 和 DeepSeek 都一样
  • 合法动作集不随模型而变化
  • 轨迹退化模式(重复/停滞)是环境动态的产物,非模型的产物
  • 反馈格式由环境定义

Harness 将这些规则从"隐性(需要模型学会)"变为"显性(在接口层强制执行)",因此消除而不是包装了模型差异

与 Parameter Adaptation 的对比

维度 Parameter Adaptation Harness Transfer
跨模型需重训 是(换模型 = 重新 SFT/RL Harness 不动)
适配对象 模型的行为分布 环境的规则结构
典型成本 Compute heavy 轨迹收集 + Coding Agent

参考