20260617:目前有914 页
This commit is contained in:
46
concepts/cross-model-harness-transfer.md
Normal file
46
concepts/cross-model-harness-transfer.md
Normal file
@@ -0,0 +1,46 @@
|
||||
---
|
||||
title: "Cross-Model Harness Transfer(跨模型 Harness 迁移)"
|
||||
created: 2026-06-11
|
||||
updated: 2026-06-11
|
||||
type: concept
|
||||
tags: [agent, harness, transfer, generalization]
|
||||
sources: [raw/papers/xu-life-harness-runtime-adaptation-2026.md]
|
||||
confidence: high
|
||||
---
|
||||
|
||||
# Cross-Model Harness Transfer
|
||||
|
||||
> 在一个模型上进化出的 Runtime Harness,直接复用于其他模型架构——无需重新训练或适配。
|
||||
|
||||
## 核心发现
|
||||
|
||||
Life-Harness 的实验揭示了一个关键性质:
|
||||
|
||||
- **源模型**:仅在 Qwen3-4B-Instruct 上进化 Harness
|
||||
- **目标**:17 个其他模型(指令微调、推理、Agent 专用模型)
|
||||
- **结果**:116/126 模型-环境组合设臵提升,平均相对增益 88.5%
|
||||
|
||||
Harness 跨模型有效,因为它捕获的是**环境侧的可复用结构**(工具契约、合法动作集、退化模式),而非**模型侧的行为特征**。
|
||||
|
||||
## 为什么能跨模型迁移
|
||||
|
||||
确定性 Agent 环境的"规则"与模型无关:
|
||||
- Tool Schema 对 Qwen 和 DeepSeek 都一样
|
||||
- 合法动作集不随模型而变化
|
||||
- 轨迹退化模式(重复/停滞)是环境动态的产物,非模型的产物
|
||||
- 反馈格式由环境定义
|
||||
|
||||
Harness 将这些规则从"隐性(需要模型学会)"变为"显性(在接口层强制执行)",因此**消除而不是包装了模型差异**。
|
||||
|
||||
## 与 Parameter Adaptation 的对比
|
||||
|
||||
| 维度 | Parameter Adaptation | Harness Transfer |
|
||||
|------|---------------------|------------------|
|
||||
| 跨模型需重训 | 是(换模型 = 重新 SFT/RL) | 否(Harness 不动) |
|
||||
| 适配对象 | 模型的行为分布 | 环境的规则结构 |
|
||||
| 典型成本 | Compute heavy | 轨迹收集 + Coding Agent |
|
||||
|
||||
## 参考
|
||||
- [[xu-life-harness|Life-Harness 论文]]
|
||||
- [[runtime-interface-adaptation|Runtime Interface Adaptation]]
|
||||
- [[harness-evolution|Harness Evolution]]
|
||||
Reference in New Issue
Block a user