20260514:增加新内容

2026-05-14 13:54:52 +08:00
parent 56c4d3ef7c
commit b116710e4c
294 changed files with 10682 additions and 255 deletions
--- a/concepts/delegated-work.md
+++ b/concepts/delegated-work.md
@@ -0,0 +1,39 @@
+---
+title: "Delegated Work / 委托工作"
+created: 2026-05-14
+type: concept
+tags: ["interaction-paradigm", "human-AI-collaboration", "trust", "knowledge-work"]
+sources: ["https://arxiv.org/abs/2604.15597"]
+---
+
+# Delegated Work
+
+委托工作（Delegated Work）是一种新兴的 LLM 交互范式：知识工作者监督 LLM 代其完成任务（如 "vibe coding"）。用户可能缺乏审查每个改动的专业知识或时间，因此必须**信任** LLM 不会引入未检测到的错误。
+
+## 与对话式交互的区别
+
+| 维度 | 对话式 | 委托式 |
+|------|--------|--------|
+| 审查力度 | 用户逐轮审核 | 用户可能跳过审查 |
+| 信任需求 | 低（即时反馈） | 高（延迟验证） |
+| 错误传播 | 单轮可纠正 | 跨轮次累积 |
+| 典型场景 | 问答、头脑风暴 | 文档编辑、代码重构 |
+
+## 委托可行性的前提
+
+1. LLM 能可靠执行领域任务
+2. LLM 不引入静默错误
+3. 错误不随时间复合增长
+
+[[delegate-52]] 的实验表明，当前模型在绝大多数领域中**不满足**这些前提。
+
+## 领域不对称性
+
+模型在 Python 编程中足够可靠（17/19 达到 "ready"），但在其他 51 个领域中远未准备好。这反映了 [[jagged-frontier|锯齿前沿]]——模型能力在领域间极不均衡。
+
+## 相关概念
+
+- [[delegate-52]] — 测试委托就绪性的基准
+- [[document-degradation]] — 委托中的核心风险
+- [[jagged-frontier]] — 委托能力的领域不对称
+- [[long-horizon-evaluation]] — 委托评估的时间维度