title, created, updated, type, tags, sources
| title |
created |
updated |
type |
tags |
sources |
| Multi-Agent Safety |
2026-06-05 |
2026-06-05 |
concept |
| agent-safety |
| multi-agent |
| coordination |
| information-flow |
|
| liu-auditing-agent-harness-safety |
|
|
Multi-Agent Safety
多 Agent 安全关注多智能体系统中的安全风险,特别是 Agent 之间的通信、委托和边界穿越引入的安全攻击面扩展。由 harnessaudit 首次在统一的骨架级审计框架中系统性评测。
单 Agent vs 多 Agent 安全风险
| 维度 |
单 Agent |
多 Agent |
| 主要风险来源 |
资源访问越界 |
资源访问 + 信息流泄露 |
| SAR(tool) |
0.91 |
0.64 |
| SAR(resource) |
0.85 |
0.63 |
| SAR(info-flow) |
N/A |
0.58 |
多 Agent 场景下,协调扩展了安全风险面:共享资源和 Agent 间通信引入了单 Agent 设置中不存在的违规路径。
核心风险
- 信息流泄露:大多数信息流违规是敏感信息泄露而非授权接收方错误——Agent 能正确识别通信对象,但无法控制共享内容
- 角色越界:关键角色(负责资源访问、跨角色协调、最终执行)的 Agent 更可能穿越安全边界
- 框架差异:不同 multi-agent-orchestration 的安全表现差异显著——OpenClaw 在工具、资源和信息流三个维度的安全性均低于 Google ADK 和 OpenAI Agent SDK
与现有工作的关系