Files
myWiki/concepts/controlled-autonomy.md
2026-06-01 10:46:01 +08:00

43 lines
1.5 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

---
title: "Controlled Autonomy (受控的自主性)"
created: 2026-05-29
updated: 2026-05-29
type: concept
tags: ["self-evolution", "agent", "control", "safety"]
sources: ["https://mp.weixin.qq.com/s/s__fdyXQG932SavQeeugcw"]
---
# Controlled Autonomy (受控的自主性)
**Controlled Autonomy** 是吕明在 SkillOpt 深度解读中提出的自进化 Agent 核心设计原则:**人类设定目标验证集和边界编辑约束Agent 在框架内自主寻找最优策略。**
## 定义
> "一种'受控的自主性'——人类设定目标验证集和边界编辑约束Agent 在框架内自主寻找最优策略。"
这与"完全自主"AGI和"完全人工"(手写 Skill形成明确区分。
## 三元结构
| 角色 | 负责 | 类比 |
|------|------|------|
| **人类** | 设定验证集 + 编辑约束 | 立法者 |
| **Optimizer** | 因果分析 + 提出编辑 | 执行者 |
| **Validation Gate** | 验证接受/拒绝 | 司法者 |
## 为什么需要"受控"
- **无需证明安全**:验证集天然保证了编辑的安全性(只接受改善)
- **可审计**:每次编辑都有 Diff + 验证分数变化
- **可回滚**:拒绝缓冲防止重复失败方向
## 与 AGI 的关系
> "这不是 AGI甚至离 AGI 还有很远。但它是通往'更具自主性的 AI 系统'的一步扎实的脚印。"
## 相关
- [[skillopt]] — 受控自主性的技术实现
- [[held-out-validation-gate]] — 验证门(受控的"司法者"
- [[textual-learning-rate]] — 编辑约束(受控的"边界"