Files
myWiki/concepts/runtime-harness-adaptation.md

45 lines
2.1 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

---
title: "Runtime Harness Adaptation运行时骨架适配"
created: 2026-06-11
updated: 2026-06-11
type: concept
tags: [agent, harness, runtime-adaptation]
sources: [raw/papers/xu-life-harness-runtime-adaptation-2026.md]
confidence: high
---
# Runtime Harness Adaptation
> 不更新模型权重,而是进化模型与确定性环境之间的 Runtime 接口层——将训练轨迹中的反复失败转化为可复用的结构化干预。
## 核心定义
Runtime Harness Adaptation 是一种 **Agent 改进范式**:保持 LLM 参数冻结(θ fixed通过适配运行时骨架 H ← A_harness(H, T_train) 来提升 Agent 的交互表现。适配后的 harness 在评估时保持固定,不修改模型权重,也不修改评估环境。
与 [[runtime-interface-adaptation|参数适配Parameter Adaptation]] 的区别在于参数适配将领域特定的行为吸收进模型权重需要随模型或环境变化重新训练Harness 适配捕获的是**环境侧的可复用结构**,具有模型无关性。
## 四个生命周期层
Life-Harness 将 Harness 适配组织为四个生命周期阶段(详见 [[xu-life-harness|Life-Harness 论文]]
1. **环境契约层** [[environment-contract-layer]] — 交互前校准工具和接口约束
2. **程序技能层** [[procedural-skill-layer]] — 从轨迹中检索可复用程序
3. **动作实现层** [[action-realization-layer]] — 执行前验证和规范化动作
4. **轨迹调控层** [[trajectory-regulation-layer]] — 执行后检测退化并触发恢复
## 为什么有效
在确定性、规则驱动的领域中,大量 Agent 失败不是模型"不够聪明",而是接口层的不匹配:
- 工具契约被误解
- 动作格式不可执行
- 反馈无法触发恢复
- 轨迹陷入重复/停滞
这些失败是**可诊断、可结构化、可跨模型复用的**——这正是 Harness 适配的用武之地。
## 参考
- [[xu-life-harness|Life-Harness 论文]]
- [[agent-harness-engineering|Agent Harness Engineering]]
- [[agent-harness-mini|Mini Agent Harness]]
- [[cross-model-harness-transfer|跨模型 Harness 迁移]]