Files
myWiki/concepts/delegated-work.md

40 lines
1.5 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

---
title: "Delegated Work / 委托工作"
created: 2026-05-14
type: concept
tags: ["interaction-paradigm", "human-AI-collaboration", "trust", "knowledge-work"]
sources: ["https://arxiv.org/abs/2604.15597"]
---
# Delegated Work
委托工作Delegated Work是一种新兴的 LLM 交互范式:知识工作者监督 LLM 代其完成任务(如 "vibe coding")。用户可能缺乏审查每个改动的专业知识或时间,因此必须**信任** LLM 不会引入未检测到的错误。
## 与对话式交互的区别
| 维度 | 对话式 | 委托式 |
|------|--------|--------|
| 审查力度 | 用户逐轮审核 | 用户可能跳过审查 |
| 信任需求 | 低(即时反馈) | 高(延迟验证) |
| 错误传播 | 单轮可纠正 | 跨轮次累积 |
| 典型场景 | 问答、头脑风暴 | 文档编辑、代码重构 |
## 委托可行性的前提
1. LLM 能可靠执行领域任务
2. LLM 不引入静默错误
3. 错误不随时间复合增长
[[delegate-52]] 的实验表明,当前模型在绝大多数领域中**不满足**这些前提。
## 领域不对称性
模型在 Python 编程中足够可靠17/19 达到 "ready"),但在其他 51 个领域中远未准备好。这反映了 [[jagged-frontier|锯齿前沿]]——模型能力在领域间极不均衡。
## 相关概念
- [[delegate-52]] — 测试委托就绪性的基准
- [[document-degradation]] — 委托中的核心风险
- [[jagged-frontier]] — 委托能力的领域不对称
- [[long-horizon-evaluation]] — 委托评估的时间维度