Autonomous Optimization (AO)

AO 是 Arbor 提出的自主科研任务形式化模型：P = (M0, O, Edev, Etest)，Agent 通过迭代实验改进研究产物，无需步骤级人工监督。

四元组

目标：M⋆ = arg max Stest(M') 约束：假设和实现决策不使用 Etest 作为探索 oracle

这防止了过拟合——在 dev 上改进但无法 transfer 到 test 的候选不应被接受。

AO 的目标不是单一响应或代码补丁，而是持续的研究轨迹。Agent 必须提出假设、物化为产物变更、解读实验反馈，并决定哪些方向应该精炼、合并或放弃。