SidneyZhang/myWiki

Files

Sidney Zhang e96b955fda

20260601

2026-06-01 10:46:01 +08:00

1.5 KiB

Raw Blame History

title, created, updated, type, tags, sources, confidence

title

created

updated

type

tags

sources

confidence

Governance & Security（治理与安全）

2026-05-23

2026-05-23

concept

agent

governance

security

compliance

audit

identity

raw/papers/agent-harness-engineering-survey-2026.md

high

Governance & Security（G 层）

ETCLOVG 的 G 层：通过权限、身份、策略、加固、审计和人类监督机制约束 Agent 行为。覆盖三个治理子层。

三个治理子层

模型级（Model-Level）：护栏（guardrails）、内容过滤器、constitutional AI
系统级（System-Level）：网关（gateways）、代理（proxies）、权限模型（permission models）
组织级（Organizational-Level）：审计（audit）、合规（compliance）、人机协同（human-in-the-loop）

关键组件

权限模型与身份管理：Agent 身份、委托、权限清单
生命周期 Hook：在关键决策点插入治理检查
组件加固：沙箱逃逸防护、prompt injection 防御
声明式宪法：如 Claude's Constitution（Anthropic, 2026a）
审计基础设施：记录所有 Agent 操作以供审查

与 capability-control-tradeoff 的关系

G 层是 control 侧的集中体现。更强的工具和更宽松的沙箱每扩展一次能力，G 层就需要相应增强审计粒度、权限边界和恢复能力。

相关概念