1.5 KiB
1.5 KiB
title, created, updated, type, tags, sources, confidence
| title | created | updated | type | tags | sources | confidence | ||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Hardening Execution Environments(硬化执行环境) | 2026-05-23 | 2026-05-23 | concept |
|
|
medium |
Hardening & Scaling Execution Environments
开放问题 1/5:使运行时基质既可测量又可组合。SandboxEscapeBench 显示前沿模型可突破沙箱,但防御工作仍碎片化。同时 one-container-per-task 模式的成本不可持续。
当前状态
- 安全:SandboxEscapeBench(Marchand et al., 2026)记录真实沙箱逃逸,但跨系统防御缺乏统一威胁模型
- 规模:SWE-World 探索 Docker-free 替代环境,但学到的转换保真度未解决
- 可移植性:Docker 假设 Linux 内核,macOS/Windows/浏览器/桌面/混合云场景的隔离和可复现性不同
未来需求
- 统一安全评估:prompt injection、目标错位、组合放大
- 成本模型:决定何时使用容器、microVM、OS 级权限边界、完整 VM、浏览器环境或学到的替代品
- 可移植性层:跨自托管、云和混合部署保持语义
Bundle vs Compose
框架集成运行时(§3.2.4)与沙箱抽象层(§3.2.7)的分裂应作为实证设计问题而非产品偏好来处理。
相关概念
- execution-environment
- standard-agent-handoffs — MCP 能否降低组合成本取决于暴露足够的状态
- agent-harness-engineering-survey