43 lines
1.4 KiB
Markdown
43 lines
1.4 KiB
Markdown
---
|
||
title: "Agent-Computer Interface (ACI)"
|
||
created: 2026-05-26
|
||
type: concept
|
||
tags: ["agent-evaluation", "interface-design", "swe-agent"]
|
||
sources: ["mini-agent-harness", "swe-agent"]
|
||
---
|
||
|
||
# Agent-Computer Interface (ACI)
|
||
|
||
> SWE-agent 提出的概念:Agent 的表现不仅取决于模型,还取决于其与计算机交互的外部接口设计。
|
||
|
||
## 定义
|
||
|
||
ACI(Agent-Computer Interface)是 Agent 与执行环境之间的交互层。设计良好的 ACI 能让 Agent 更高效地查看文件、编辑代码、运行测试、接收错误反馈。
|
||
|
||
## 核心洞察
|
||
|
||
- **接口即能力边界**:Agent 能做的仅限于 ACI 暴露的操作
|
||
- **信息密度**:如何将文件内容、错误信息、测试结果反馈给模型,直接影响表现
|
||
- **错误可操作性**:返回的错误信息是否足够让 Agent 定位和修复问题
|
||
|
||
## ACI 设计要素
|
||
|
||
1. **查看**:文件浏览、搜索、diff 查看
|
||
2. **编辑**:代码修改、文件操作
|
||
3. **执行**:运行命令、测试、构建
|
||
4. **反馈**:错误信息、日志、测试结果
|
||
|
||
## 与 Mini Harness 的关系
|
||
|
||
[[agent-harness-mini|mini harness]] 中的 Tools 模块本质上就是 ACI 的简化版——定义了 Agent 与环境交互的接口集。
|
||
|
||
## 参考
|
||
|
||
- SWE-agent 论文中关于 ACI 设计的详细讨论
|
||
- [[terminal-bench]] — 终端环境的 ACI 实现
|
||
|
||
## 相关页面
|
||
|
||
- [[agent-harness-mini]] — Tools 模块对应 ACI
|
||
- [[terminal-bench]] — 终端 ACI 的评测实现
|