Files
myWiki/concepts/cross-model-harness-transfer.md

47 lines
1.8 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

---
title: "Cross-Model Harness Transfer跨模型 Harness 迁移)"
created: 2026-06-11
updated: 2026-06-11
type: concept
tags: [agent, harness, transfer, generalization]
sources: [raw/papers/xu-life-harness-runtime-adaptation-2026.md]
confidence: high
---
# Cross-Model Harness Transfer
> 在一个模型上进化出的 Runtime Harness直接复用于其他模型架构——无需重新训练或适配。
## 核心发现
Life-Harness 的实验揭示了一个关键性质:
- **源模型**:仅在 Qwen3-4B-Instruct 上进化 Harness
- **目标**17 个其他模型指令微调、推理、Agent 专用模型)
- **结果**116/126 模型-环境组合设臵提升,平均相对增益 88.5%
Harness 跨模型有效,因为它捕获的是**环境侧的可复用结构**(工具契约、合法动作集、退化模式),而非**模型侧的行为特征**。
## 为什么能跨模型迁移
确定性 Agent 环境的"规则"与模型无关:
- Tool Schema 对 Qwen 和 DeepSeek 都一样
- 合法动作集不随模型而变化
- 轨迹退化模式(重复/停滞)是环境动态的产物,非模型的产物
- 反馈格式由环境定义
Harness 将这些规则从"隐性(需要模型学会)"变为"显性(在接口层强制执行)",因此**消除而不是包装了模型差异**。
## 与 Parameter Adaptation 的对比
| 维度 | Parameter Adaptation | Harness Transfer |
|------|---------------------|------------------|
| 跨模型需重训 | 是(换模型 = 重新 SFT/RL | 否Harness 不动) |
| 适配对象 | 模型的行为分布 | 环境的规则结构 |
| 典型成本 | Compute heavy | 轨迹收集 + Coding Agent |
## 参考
- [[xu-life-harness|Life-Harness 论文]]
- [[runtime-interface-adaptation|Runtime Interface Adaptation]]
- [[harness-evolution|Harness Evolution]]