47 lines
1.8 KiB
Markdown
47 lines
1.8 KiB
Markdown
---
|
||
title: "Cross-Model Harness Transfer(跨模型 Harness 迁移)"
|
||
created: 2026-06-11
|
||
updated: 2026-06-11
|
||
type: concept
|
||
tags: [agent, harness, transfer, generalization]
|
||
sources: [raw/papers/xu-life-harness-runtime-adaptation-2026.md]
|
||
confidence: high
|
||
---
|
||
|
||
# Cross-Model Harness Transfer
|
||
|
||
> 在一个模型上进化出的 Runtime Harness,直接复用于其他模型架构——无需重新训练或适配。
|
||
|
||
## 核心发现
|
||
|
||
Life-Harness 的实验揭示了一个关键性质:
|
||
|
||
- **源模型**:仅在 Qwen3-4B-Instruct 上进化 Harness
|
||
- **目标**:17 个其他模型(指令微调、推理、Agent 专用模型)
|
||
- **结果**:116/126 模型-环境组合设臵提升,平均相对增益 88.5%
|
||
|
||
Harness 跨模型有效,因为它捕获的是**环境侧的可复用结构**(工具契约、合法动作集、退化模式),而非**模型侧的行为特征**。
|
||
|
||
## 为什么能跨模型迁移
|
||
|
||
确定性 Agent 环境的"规则"与模型无关:
|
||
- Tool Schema 对 Qwen 和 DeepSeek 都一样
|
||
- 合法动作集不随模型而变化
|
||
- 轨迹退化模式(重复/停滞)是环境动态的产物,非模型的产物
|
||
- 反馈格式由环境定义
|
||
|
||
Harness 将这些规则从"隐性(需要模型学会)"变为"显性(在接口层强制执行)",因此**消除而不是包装了模型差异**。
|
||
|
||
## 与 Parameter Adaptation 的对比
|
||
|
||
| 维度 | Parameter Adaptation | Harness Transfer |
|
||
|------|---------------------|------------------|
|
||
| 跨模型需重训 | 是(换模型 = 重新 SFT/RL) | 否(Harness 不动) |
|
||
| 适配对象 | 模型的行为分布 | 环境的规则结构 |
|
||
| 典型成本 | Compute heavy | 轨迹收集 + Coding Agent |
|
||
|
||
## 参考
|
||
- [[xu-life-harness|Life-Harness 论文]]
|
||
- [[runtime-interface-adaptation|Runtime Interface Adaptation]]
|
||
- [[harness-evolution|Harness Evolution]]
|