20260601
This commit is contained in:
42
concepts/agent-computer-interface.md
Normal file
42
concepts/agent-computer-interface.md
Normal file
@@ -0,0 +1,42 @@
|
||||
---
|
||||
title: "Agent-Computer Interface (ACI)"
|
||||
created: 2026-05-26
|
||||
type: concept
|
||||
tags: ["agent-evaluation", "interface-design", "swe-agent"]
|
||||
sources: ["mini-agent-harness", "swe-agent"]
|
||||
---
|
||||
|
||||
# Agent-Computer Interface (ACI)
|
||||
|
||||
> SWE-agent 提出的概念:Agent 的表现不仅取决于模型,还取决于其与计算机交互的外部接口设计。
|
||||
|
||||
## 定义
|
||||
|
||||
ACI(Agent-Computer Interface)是 Agent 与执行环境之间的交互层。设计良好的 ACI 能让 Agent 更高效地查看文件、编辑代码、运行测试、接收错误反馈。
|
||||
|
||||
## 核心洞察
|
||||
|
||||
- **接口即能力边界**:Agent 能做的仅限于 ACI 暴露的操作
|
||||
- **信息密度**:如何将文件内容、错误信息、测试结果反馈给模型,直接影响表现
|
||||
- **错误可操作性**:返回的错误信息是否足够让 Agent 定位和修复问题
|
||||
|
||||
## ACI 设计要素
|
||||
|
||||
1. **查看**:文件浏览、搜索、diff 查看
|
||||
2. **编辑**:代码修改、文件操作
|
||||
3. **执行**:运行命令、测试、构建
|
||||
4. **反馈**:错误信息、日志、测试结果
|
||||
|
||||
## 与 Mini Harness 的关系
|
||||
|
||||
[[agent-harness-mini|mini harness]] 中的 Tools 模块本质上就是 ACI 的简化版——定义了 Agent 与环境交互的接口集。
|
||||
|
||||
## 参考
|
||||
|
||||
- SWE-agent 论文中关于 ACI 设计的详细讨论
|
||||
- [[terminal-bench]] — 终端环境的 ACI 实现
|
||||
|
||||
## 相关页面
|
||||
|
||||
- [[agent-harness-mini]] — Tools 模块对应 ACI
|
||||
- [[terminal-bench]] — 终端 ACI 的评测实现
|
||||
Reference in New Issue
Block a user