Files
myWiki/concepts/execution-environment.md
2026-06-01 10:46:01 +08:00

1.4 KiB
Raw Blame History

title, created, updated, type, tags, sources, confidence
title created updated type tags sources confidence
Execution Environment执行环境与沙箱 2026-05-23 2026-05-23 concept
agent
sandbox
infrastructure
execution
security
raw/papers/agent-harness-engineering-survey-2026.md
high

Execution Environment & SandboxE 层)

ETCLOVG 的 E 层:决定 Agent 代码在哪里运行、受什么沙箱约束。正在成为安全、可扩展性和可移植性交汇的控制边界。

主要子类别

  • 通用托管沙箱:如 Firecracker microVMs、Docker 容器、OpenSandbox
  • 代码专用沙箱:针对编程任务的隔离环境
  • 浏览器评估环境WebArena、BrowserBench 等
  • OS 级权限沙箱Anthropic sandbox-runtime
  • 计算机使用 Agent 基础设施:桌面/浏览器自动化
  • 框架集成运行时 vs 沙箱抽象层bundle-vs-compose 之争

核心挑战

  • 沙箱逃逸SandboxEscapeBench 发现前沿模型可突破沙箱Marchand et al., 2026
  • 大规模并行训练/评估中的 one-container-per-task 模式成本过高
  • Docker 假设 Linux 内核,跨平台可移植性未解决

开放问题

如何使运行时基质既可测量可组合——安全评估统一化、成本模型选择、跨部署环境可移植性。

相关概念