20260617:目前有914 页

This commit is contained in:
2026-06-17 15:02:40 +08:00
parent e96b955fda
commit 91fac5b6fc
423 changed files with 20687 additions and 34 deletions

View File

@@ -0,0 +1,46 @@
---
title: "Cross-Model Harness Transfer跨模型 Harness 迁移)"
created: 2026-06-11
updated: 2026-06-11
type: concept
tags: [agent, harness, transfer, generalization]
sources: [raw/papers/xu-life-harness-runtime-adaptation-2026.md]
confidence: high
---
# Cross-Model Harness Transfer
> 在一个模型上进化出的 Runtime Harness直接复用于其他模型架构——无需重新训练或适配。
## 核心发现
Life-Harness 的实验揭示了一个关键性质:
- **源模型**:仅在 Qwen3-4B-Instruct 上进化 Harness
- **目标**17 个其他模型指令微调、推理、Agent 专用模型)
- **结果**116/126 模型-环境组合设臵提升,平均相对增益 88.5%
Harness 跨模型有效,因为它捕获的是**环境侧的可复用结构**(工具契约、合法动作集、退化模式),而非**模型侧的行为特征**。
## 为什么能跨模型迁移
确定性 Agent 环境的"规则"与模型无关:
- Tool Schema 对 Qwen 和 DeepSeek 都一样
- 合法动作集不随模型而变化
- 轨迹退化模式(重复/停滞)是环境动态的产物,非模型的产物
- 反馈格式由环境定义
Harness 将这些规则从"隐性(需要模型学会)"变为"显性(在接口层强制执行)",因此**消除而不是包装了模型差异**。
## 与 Parameter Adaptation 的对比
| 维度 | Parameter Adaptation | Harness Transfer |
|------|---------------------|------------------|
| 跨模型需重训 | 是(换模型 = 重新 SFT/RL | 否Harness 不动) |
| 适配对象 | 模型的行为分布 | 环境的规则结构 |
| 典型成本 | Compute heavy | 轨迹收集 + Coding Agent |
## 参考
- [[xu-life-harness|Life-Harness 论文]]
- [[runtime-interface-adaptation|Runtime Interface Adaptation]]
- [[harness-evolution|Harness Evolution]]