Model与Harness的关系演进

作者: 吕明 | 来源: 微信公众号 | 收录: 2026-05-29

核心命题

随着 autoharness 等工作的出现，Model 与 Harness 之间的边界正在发生根本性演进——"策略算法"与"工程约束"不再是两个独立世界，而是正在融合为一个紧密依赖、难以割裂的共同体。

作者从第一性原理出发，提炼出 GenAI 的三个关键判别要素：

支柱	含义	体现
生成式 Generative	推理模式分布的巨大灵活性	CoT、Prompt Engineering、Harness 工程化落地
通用性 General	Scaling law 驱动的泛化能力	跨任务迁移、零样本推理
统一性 Unification	策略算法与工程约束的统一	形式化规则编译 + 策略空间 tokenlized 融合

文章详细剖析了 autoharness 的三种 Harness 模式：

核心机制：多代码假设树 + Thompson 采样 + Refiner-Critic 环

关键数据：145 个游戏 100% 合法率，Flash+Harness 对 Pro 胜率 56.3% vs 38.2%

文章引入 OpenAI 翁家翌提出的 heuristic-learning（启发式学习），定位为替代传统梯度下降的新学习范式：

"性能提升不只能依赖于模型参数规模，也应关注 Agent Architecture 的 Harness 层"

"经验或知识不仅可以被'训练'到参数里，还可以被'编程'为可维护、可进化的软件系统"

"也许世界的本质即是由泛化策略 + 抽象约束的组合控制和运转的"