SidneyZhang/myWiki

Files

Sidney Zhang 91fac5b6fc

20260617:目前有914 页

2026-06-17 15:02:40 +08:00

1.8 KiB

Raw Blame History

title, created, updated, type, tags, sources, confidence

title

created

updated

type

tags

sources

confidence

Cross-Model Harness Transfer（跨模型 Harness 迁移）

2026-06-11

2026-06-11

concept

agent

harness

transfer

generalization

raw/papers/xu-life-harness-runtime-adaptation-2026.md

high

Cross-Model Harness Transfer

在一个模型上进化出的 Runtime Harness，直接复用于其他模型架构——无需重新训练或适配。

核心发现

Life-Harness 的实验揭示了一个关键性质：

源模型：仅在 Qwen3-4B-Instruct 上进化 Harness
目标：17 个其他模型（指令微调、推理、Agent 专用模型）
结果：116/126 模型-环境组合设臵提升，平均相对增益 88.5%

Harness 跨模型有效，因为它捕获的是环境侧的可复用结构（工具契约、合法动作集、退化模式），而非模型侧的行为特征。

为什么能跨模型迁移

确定性 Agent 环境的"规则"与模型无关：

Tool Schema 对 Qwen 和 DeepSeek 都一样
合法动作集不随模型而变化
轨迹退化模式（重复/停滞）是环境动态的产物，非模型的产物
反馈格式由环境定义

Harness 将这些规则从"隐性（需要模型学会）"变为"显性（在接口层强制执行）"，因此消除而不是包装了模型差异。

与 Parameter Adaptation 的对比

维度	Parameter Adaptation	Harness Transfer
跨模型需重训	是（换模型 = 重新 SFT/RL）	否（Harness 不动）
适配对象	模型的行为分布	环境的规则结构
典型成本	Compute heavy	轨迹收集 + Coding Agent

参考