Files
myWiki/concepts/harness-coupling-problem.md
2026-06-01 10:46:01 +08:00

1.5 KiB
Raw Blame History

title, created, updated, type, tags, sources, confidence
title created updated type tags sources confidence
Harness Coupling ProblemHarness 耦合问题) 2026-05-23 2026-05-23 concept
agent
coupling
system-design
optimization
raw/papers/agent-harness-engineering-survey-2026.md
high

Harness Coupling Problem

Harness 各层高度耦合,局部优化可能变得脆弱。一个在隔离环境中看起来有益的更改,与其他控制回路组合后可能降低整体表现。

耦合的四种表现

  1. 执行环境 → 评估:包可用性、重置语义、延迟和故障模式改变评估结果
  2. 工具描述 → 模型行为:工具 Schema 消耗 context budget 并塑造模型推理
  3. 可观测性 → 治理:追踪只有在相同粒度捕获身份和权限状态时才成为治理证据
  4. 评估 → 编排:评估设计通过奖励/惩罚某些恢复回路来反馈编排

闭环框架

在闭环控制框架下,对上下文策略、工具 Schema、验证器或恢复回路的每一次更改都在改变控制器 C_H从而改变同一模型的测量行为Bölük, 2026b

这意味着 Agent 分数无法纯粹归因于模型,而不指定周围的控制器。

工程含义

Harness 变更应作为系统变更来测试——不是 prompt、tool、memory、sandbox、verifier 或 monitor 的独立调优,而是作为一个整体 rollout 的组合效果。

相关概念