This commit is contained in:
2026-06-01 10:46:01 +08:00
parent 2faf4bb002
commit e96b955fda
221 changed files with 10219 additions and 332 deletions

View File

@@ -0,0 +1,39 @@
---
title: "Practitioner-Research Gap从业者-研究鸿沟)"
created: 2026-05-30
updated: 2026-05-30
type: concept
tags: [agent, production, research, gap]
sources: [[agent-harness-engineering-survey]]
confidence: high
---
# Practitioner-Research Gap
> 从业者知道 Harness 基础设施很重要,但缺乏正式词汇来描述"为什么"——这是《Agent Harness Engineering: A Survey》试图弥合的核心鸿沟。
## 鸿沟的两侧
### 从业者侧(已知但未形式化)
- OpenAIHarness engineering 定义为"设计环境、约束、文档和反馈循环"
- Anthropic有效 Agent 应使用简单可检查架构、为 Agent 而非人类设计工具接口
- 从业者在实践中大量投资 Harness但缺少统一的理论框架
### 研究者侧(已研究但未整合)
- 学术界分别研究了记忆、工具使用、规划、安全等**组件**
- 但缺少对这些组件如何**整合成可靠运行系统**的系统性研究
- 研究社区仍以模型为分析单元
## 三个 Harmess-Only 证据
论文用三个实证结果证明了 Harness 的独立价值(模型固定,只改变 Harness
1. **Bölük (2026a)**:只修改 tool harness编程基准增益达 10×
2. **Trivedy (2026)**:系统 prompt 重构 + 中间件注入Terminal-Bench 2.0 从 52.8% → 66.5%
3. **Meta-Harness (Lee et al., 2026)**:自动化 harness 优化Terminal-Bench-2 达 76.4%
这三项结果均超过同期"模型改进"的典型 2-4 个百分点增益。
## 相关概念
- [[binding-constraint-thesis]] — 约束瓶颈论
- [[prompt-to-harness-evolution]] — 三阶段工程演进
- [[agent-harness-engineering]] — 总体框架