SidneyZhang/myWiki

Files

Sidney Zhang 91fac5b6fc

20260617:目前有914 页

2026-06-17 15:02:40 +08:00

1.7 KiB

Raw Blame History

title, created, updated, type, tags, sources

title

created

updated

type

tags

sources

Multi-Agent Safety

2026-06-05

2026-06-05

concept

agent-safety

multi-agent

coordination

information-flow

liu-auditing-agent-harness-safety

Multi-Agent Safety

多 Agent 安全关注多智能体系统中的安全风险，特别是 Agent 之间的通信、委托和边界穿越引入的安全攻击面扩展。由 harnessaudit 首次在统一的骨架级审计框架中系统性评测。

单 Agent vs 多 Agent 安全风险

维度	单 Agent	多 Agent
主要风险来源	资源访问越界	资源访问 + 信息流泄露
SAR(tool)	0.91	0.64
SAR(resource)	0.85	0.63
SAR(info-flow)	N/A	0.58

多 Agent 场景下，协调扩展了安全风险面：共享资源和 Agent 间通信引入了单 Agent 设置中不存在的违规路径。

核心风险

信息流泄露：大多数信息流违规是敏感信息泄露而非授权接收方错误——Agent 能正确识别通信对象，但无法控制共享内容
角色越界：关键角色（负责资源访问、跨角色协调、最终执行）的 Agent 更可能穿越安全边界
框架差异：不同 multi-agent-orchestration 的安全表现差异显著——OpenClaw 在工具、资源和信息流三个维度的安全性均低于 Google ADK 和 OpenAI Agent SDK

与现有工作的关系

agent-communication-stack 定义了通信层次，多 Agent 安全关注通信中的信息边界
agent-network-topology 影响安全风险传播路径
harness-as-policy 的策略约束在多 Agent 中需要同时控制工具权限和通信权限