20260617:目前有914 页
This commit is contained in:
35
concepts/multi-agent-safety.md
Normal file
35
concepts/multi-agent-safety.md
Normal file
@@ -0,0 +1,35 @@
|
||||
---
|
||||
title: "Multi-Agent Safety"
|
||||
created: 2026-06-05
|
||||
updated: 2026-06-05
|
||||
type: concept
|
||||
tags: [agent-safety, multi-agent, coordination, information-flow]
|
||||
sources: [[liu-auditing-agent-harness-safety]]
|
||||
---
|
||||
|
||||
# Multi-Agent Safety
|
||||
|
||||
**多 Agent 安全**关注多智能体系统中的安全风险,特别是 Agent 之间的通信、委托和边界穿越引入的安全攻击面扩展。由 [[harnessaudit|HarnessAudit]] 首次在统一的骨架级审计框架中系统性评测。
|
||||
|
||||
## 单 Agent vs 多 Agent 安全风险
|
||||
|
||||
| 维度 | 单 Agent | 多 Agent |
|
||||
|------|---------|---------|
|
||||
| 主要风险来源 | 资源访问越界 | 资源访问 + 信息流泄露 |
|
||||
| SAR(tool) | 0.91 | 0.64 |
|
||||
| SAR(resource) | 0.85 | 0.63 |
|
||||
| SAR(info-flow) | N/A | 0.58 |
|
||||
|
||||
多 Agent 场景下,**协调扩展了安全风险面**:共享资源和 Agent 间通信引入了单 Agent 设置中不存在的违规路径。
|
||||
|
||||
## 核心风险
|
||||
|
||||
1. **信息流泄露**:大多数信息流违规是敏感信息泄露而非授权接收方错误——Agent 能正确识别通信对象,但无法控制共享内容
|
||||
2. **角色越界**:关键角色(负责资源访问、跨角色协调、最终执行)的 Agent 更可能穿越安全边界
|
||||
3. **框架差异**:不同 [[multi-agent-orchestration|多 Agent 编排框架]] 的安全表现差异显著——OpenClaw 在工具、资源和信息流三个维度的安全性均低于 Google ADK 和 OpenAI Agent SDK
|
||||
|
||||
## 与现有工作的关系
|
||||
|
||||
- [[agent-communication-stack|Agent 通信栈]] 定义了通信层次,多 Agent 安全关注通信中的信息边界
|
||||
- [[agent-network-topology|Agent 网络拓扑]] 影响安全风险传播路径
|
||||
- [[harness-as-policy]] 的策略约束在多 Agent 中需要同时控制工具权限和通信权限
|
||||
Reference in New Issue
Block a user