41 lines
1.7 KiB
Markdown
41 lines
1.7 KiB
Markdown
---
|
||
title: "Action Realization Layer(动作实现层)"
|
||
created: 2026-06-11
|
||
updated: 2026-06-11
|
||
type: concept
|
||
tags: [agent, harness, action-validation, execution]
|
||
sources: [raw/papers/xu-life-harness-runtime-adaptation-2026.md]
|
||
---
|
||
|
||
# Action Realization Layer
|
||
|
||
> Life-Harness 的第③层:在模型输出动作之后、环境执行之前,基于确定性环境证据进行**可执行性验证和规范化**,阻断确定会失败的动作。
|
||
|
||
## 机制
|
||
|
||
```
|
||
z_t = REALIZE_ACTION(a_t, τ_t, s_t)
|
||
z_t ∈ {EXEC(a_t), BLOCK(m_t)}
|
||
```
|
||
|
||
该层接收模型的原始动作 a_t 和当前轨迹/状态上下文,利用**确定性的环境证据**(tool schema、合法动作集、参数约束、任务策略)判断 a_t 是否合法可执行:
|
||
|
||
- 若合法 → 规范化后提交给环境执行
|
||
- 若不合法 → 返回阻塞消息 m_t 给模型,阻止无效调用消耗环境步骤配额
|
||
|
||
## 为什么关键
|
||
|
||
在 Life-Harness 的失败诊断中,**动作实现失败(Action Realization Failure)**占约 23%——模型的**意图本身合理**,但表达格式不符合环境的执行要求(如自由文本代替结构化 tool call、参数缺失或类型错误)。这些问题在确定性的规则环境下完全可被检测和阻断——不需要更强的模型推理能力。
|
||
|
||
## 设计原则
|
||
|
||
- **确定性验证**:只使用可程序化验证的环境约束,不做模糊语义判断
|
||
- **规范化**:将合法但格式松散的动作转为标准格式
|
||
- **即时反馈**:阻塞消息让模型立即修正,避免浪费后续步骤
|
||
|
||
## 参考
|
||
- [[xu-life-harness|Life-Harness 论文]]
|
||
- [[environment-contract-layer|环境契约层]]
|
||
- [[trajectory-regulation-layer|轨迹调控层]]
|
||
- [[deterministic-agent-failures|确定性 Agent 失败分类]]
|