1.8 KiB
1.8 KiB
title, created, updated, type, tags, sources, confidence
| title | created | updated | type | tags | sources | confidence | |||||
|---|---|---|---|---|---|---|---|---|---|---|---|
| Cross-Model Harness Transfer(跨模型 Harness 迁移) | 2026-06-11 | 2026-06-11 | concept |
|
|
high |
Cross-Model Harness Transfer
在一个模型上进化出的 Runtime Harness,直接复用于其他模型架构——无需重新训练或适配。
核心发现
Life-Harness 的实验揭示了一个关键性质:
- 源模型:仅在 Qwen3-4B-Instruct 上进化 Harness
- 目标:17 个其他模型(指令微调、推理、Agent 专用模型)
- 结果:116/126 模型-环境组合设臵提升,平均相对增益 88.5%
Harness 跨模型有效,因为它捕获的是环境侧的可复用结构(工具契约、合法动作集、退化模式),而非模型侧的行为特征。
为什么能跨模型迁移
确定性 Agent 环境的"规则"与模型无关:
- Tool Schema 对 Qwen 和 DeepSeek 都一样
- 合法动作集不随模型而变化
- 轨迹退化模式(重复/停滞)是环境动态的产物,非模型的产物
- 反馈格式由环境定义
Harness 将这些规则从"隐性(需要模型学会)"变为"显性(在接口层强制执行)",因此消除而不是包装了模型差异。
与 Parameter Adaptation 的对比
| 维度 | Parameter Adaptation | Harness Transfer |
|---|---|---|
| 跨模型需重训 | 是(换模型 = 重新 SFT/RL) | 否(Harness 不动) |
| 适配对象 | 模型的行为分布 | 环境的规则结构 |
| 典型成本 | Compute heavy | 轨迹收集 + Coding Agent |