1.4 KiB
1.4 KiB
title, created, updated, type, tags, sources, confidence
| title | created | updated | type | tags | sources | confidence | ||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Execution Environment(执行环境与沙箱) | 2026-05-23 | 2026-05-23 | concept |
|
|
high |
Execution Environment & Sandbox(E 层)
ETCLOVG 的 E 层:决定 Agent 代码在哪里运行、受什么沙箱约束。正在成为安全、可扩展性和可移植性交汇的控制边界。
主要子类别
- 通用托管沙箱:如 Firecracker microVMs、Docker 容器、OpenSandbox
- 代码专用沙箱:针对编程任务的隔离环境
- 浏览器评估环境:WebArena、BrowserBench 等
- OS 级权限沙箱:Anthropic sandbox-runtime
- 计算机使用 Agent 基础设施:桌面/浏览器自动化
- 框架集成运行时 vs 沙箱抽象层:bundle-vs-compose 之争
核心挑战
- 沙箱逃逸:SandboxEscapeBench 发现前沿模型可突破沙箱(Marchand et al., 2026)
- 大规模并行训练/评估中的 one-container-per-task 模式成本过高
- Docker 假设 Linux 内核,跨平台可移植性未解决
开放问题
如何使运行时基质既可测量又可组合——安全评估统一化、成本模型选择、跨部署环境可移植性。
相关概念
- etclovg-taxonomy — ETCLOVG 体系
- hardening-execution-environments — 硬化执行环境
- agent-harness-engineering-survey