Files
myWiki/concepts/binding-constraint-thesis.md
2026-06-01 10:46:01 +08:00

1.3 KiB
Raw Blame History

title, created, updated, type, tags, sources, confidence
title created updated type tags sources confidence
Binding-Constraint Thesis约束瓶颈论 2026-05-23 2026-05-23 concept
agent
infrastructure
reliability
thesis
raw/papers/agent-harness-engineering-survey-2026.md
high

Binding-Constraint Thesis

Agent 在真实世界中的可靠性瓶颈不在模型本身而在包裹模型的基础设施——Agent Execution Harness。基础设施质量而非模型能力设定了 Agent 可靠性的天花板。

三大证据链

  1. 工程演进证据:从 Prompt → Context → Harness Engineering 的三阶段演进表明,约束瓶颈随工程成熟度逐步上移
  2. 跨层综合证据cost-quality-speed-trilemmacapability-control-tradeoffharness-coupling-problem 三者都无法在单层内解决
  3. 开放问题证据:五大开放问题的核心都是 harness 层面而非模型层面的问题

关键实验

  • Bölük (2026a):仅改变 harness 格式不改变模型15 个 LLM 的编程能力同时提升
  • Anthropic (2026a):基础设施设置在可测量地改变 benchmark 分数

相关概念