SidneyZhang/myWiki

Files

Sidney Zhang 91fac5b6fc

20260617:目前有914 页

2026-06-17 15:02:40 +08:00

1.7 KiB

Raw Blame History

title, created, updated, type, tags, sources

title

created

updated

type

tags

sources

Trajectory Regulation Layer（轨迹调控层）

2026-06-11

2026-06-11

concept

agent

harness

trajectory

recovery

monitoring

raw/papers/xu-life-harness-runtime-adaptation-2026.md

Trajectory Regulation Layer

Life-Harness 的第④层：环境反馈返回后，监控轨迹级模式，检测退化信号并在必要时触发恢复干预。

机制

r_t = REGULATE_TRAJECTORY(τ_t, a_t, o_{t+1}, b_t)

其中 b_t = B - t - 1 是剩余步骤预算。输出 r_t 可能是：

空 — 轨迹正常，无需干预
软恢复消息 — 轻微偏离，提示纠正
重复失败警告 — 检测到模式重复
强纠正指令 — 轨迹明显退化，需要强制重定向

检测的退化模式

该层不依赖于深度语义理解，而是从轨迹级模式中检测问题：

重复（Repetition）：连续发出相同的无效命令
停滞（Stagnation）：在等价状态间循环，无实质进展
无效重试（Invalid Retries）：反复重试已知失败的操作
预算耗尽（Budget Exhaustion）：剩余步骤不足以完成任务

设计哲学

这类失败是自强化（self-reinforcing）的——Agent 陷入循环后不会自行跳出。它们通常不需要深度推理即可从轨迹模式中检测，但需要外部介入才能打断。这正是 Regulation Layer 的价值。

在 Life-Harness 的失败诊断中，轨迹退化占 17%。

参考