1.5 KiB
1.5 KiB
title, created, type, tags, sources
| title | created | type | tags | sources | |||||
|---|---|---|---|---|---|---|---|---|---|
| Delegated Work / 委托工作 | 2026-05-14 | concept |
|
|
Delegated Work
委托工作(Delegated Work)是一种新兴的 LLM 交互范式:知识工作者监督 LLM 代其完成任务(如 "vibe coding")。用户可能缺乏审查每个改动的专业知识或时间,因此必须信任 LLM 不会引入未检测到的错误。
与对话式交互的区别
| 维度 | 对话式 | 委托式 |
|---|---|---|
| 审查力度 | 用户逐轮审核 | 用户可能跳过审查 |
| 信任需求 | 低(即时反馈) | 高(延迟验证) |
| 错误传播 | 单轮可纠正 | 跨轮次累积 |
| 典型场景 | 问答、头脑风暴 | 文档编辑、代码重构 |
委托可行性的前提
- LLM 能可靠执行领域任务
- LLM 不引入静默错误
- 错误不随时间复合增长
delegate-52 的实验表明,当前模型在绝大多数领域中不满足这些前提。
领域不对称性
模型在 Python 编程中足够可靠(17/19 达到 "ready"),但在其他 51 个领域中远未准备好。这反映了 jagged-frontier——模型能力在领域间极不均衡。
相关概念
- delegate-52 — 测试委托就绪性的基准
- document-degradation — 委托中的核心风险
- jagged-frontier — 委托能力的领域不对称
- long-horizon-evaluation — 委托评估的时间维度