Files
myWiki/concepts/hardening-execution-environments.md
2026-06-01 10:46:01 +08:00

1.5 KiB
Raw Blame History

title, created, updated, type, tags, sources, confidence
title created updated type tags sources confidence
Hardening Execution Environments硬化执行环境 2026-05-23 2026-05-23 concept
agent
security
sandbox
execution
hardening
raw/papers/agent-harness-engineering-survey-2026.md
medium

Hardening & Scaling Execution Environments

开放问题 1/5使运行时基质既可测量可组合。SandboxEscapeBench 显示前沿模型可突破沙箱,但防御工作仍碎片化。同时 one-container-per-task 模式的成本不可持续。

当前状态

  • 安全SandboxEscapeBenchMarchand et al., 2026记录真实沙箱逃逸但跨系统防御缺乏统一威胁模型
  • 规模SWE-World 探索 Docker-free 替代环境,但学到的转换保真度未解决
  • 可移植性Docker 假设 Linux 内核macOS/Windows/浏览器/桌面/混合云场景的隔离和可复现性不同

未来需求

  1. 统一安全评估prompt injection、目标错位、组合放大
  2. 成本模型决定何时使用容器、microVM、OS 级权限边界、完整 VM、浏览器环境或学到的替代品
  3. 可移植性层:跨自托管、云和混合部署保持语义

Bundle vs Compose

框架集成运行时§3.2.4与沙箱抽象层§3.2.7)的分裂应作为实证设计问题而非产品偏好来处理。

相关概念