Files
myWiki/concepts/multi-agent-safety.md

36 lines
1.7 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

---
title: "Multi-Agent Safety"
created: 2026-06-05
updated: 2026-06-05
type: concept
tags: [agent-safety, multi-agent, coordination, information-flow]
sources: [[liu-auditing-agent-harness-safety]]
---
# Multi-Agent Safety
**多 Agent 安全**关注多智能体系统中的安全风险,特别是 Agent 之间的通信、委托和边界穿越引入的安全攻击面扩展。由 [[harnessaudit|HarnessAudit]] 首次在统一的骨架级审计框架中系统性评测。
## 单 Agent vs 多 Agent 安全风险
| 维度 | 单 Agent | 多 Agent |
|------|---------|---------|
| 主要风险来源 | 资源访问越界 | 资源访问 + 信息流泄露 |
| SAR(tool) | 0.91 | 0.64 |
| SAR(resource) | 0.85 | 0.63 |
| SAR(info-flow) | N/A | 0.58 |
多 Agent 场景下,**协调扩展了安全风险面**:共享资源和 Agent 间通信引入了单 Agent 设置中不存在的违规路径。
## 核心风险
1. **信息流泄露**大多数信息流违规是敏感信息泄露而非授权接收方错误——Agent 能正确识别通信对象,但无法控制共享内容
2. **角色越界**:关键角色(负责资源访问、跨角色协调、最终执行)的 Agent 更可能穿越安全边界
3. **框架差异**:不同 [[multi-agent-orchestration|多 Agent 编排框架]] 的安全表现差异显著——OpenClaw 在工具、资源和信息流三个维度的安全性均低于 Google ADK 和 OpenAI Agent SDK
## 与现有工作的关系
- [[agent-communication-stack|Agent 通信栈]] 定义了通信层次,多 Agent 安全关注通信中的信息边界
- [[agent-network-topology|Agent 网络拓扑]] 影响安全风险传播路径
- [[harness-as-policy]] 的策略约束在多 Agent 中需要同时控制工具权限和通信权限