20260601
This commit is contained in:
42
concepts/controlled-autonomy.md
Normal file
42
concepts/controlled-autonomy.md
Normal file
@@ -0,0 +1,42 @@
|
||||
---
|
||||
title: "Controlled Autonomy (受控的自主性)"
|
||||
created: 2026-05-29
|
||||
updated: 2026-05-29
|
||||
type: concept
|
||||
tags: ["self-evolution", "agent", "control", "safety"]
|
||||
sources: ["https://mp.weixin.qq.com/s/s__fdyXQG932SavQeeugcw"]
|
||||
---
|
||||
|
||||
# Controlled Autonomy (受控的自主性)
|
||||
|
||||
**Controlled Autonomy** 是吕明在 SkillOpt 深度解读中提出的自进化 Agent 核心设计原则:**人类设定目标(验证集)和边界(编辑约束),Agent 在框架内自主寻找最优策略。**
|
||||
|
||||
## 定义
|
||||
|
||||
> "一种'受控的自主性'——人类设定目标(验证集)和边界(编辑约束),Agent 在框架内自主寻找最优策略。"
|
||||
|
||||
这与"完全自主"(AGI)和"完全人工"(手写 Skill)形成明确区分。
|
||||
|
||||
## 三元结构
|
||||
|
||||
| 角色 | 负责 | 类比 |
|
||||
|------|------|------|
|
||||
| **人类** | 设定验证集 + 编辑约束 | 立法者 |
|
||||
| **Optimizer** | 因果分析 + 提出编辑 | 执行者 |
|
||||
| **Validation Gate** | 验证接受/拒绝 | 司法者 |
|
||||
|
||||
## 为什么需要"受控"
|
||||
|
||||
- **无需证明安全**:验证集天然保证了编辑的安全性(只接受改善)
|
||||
- **可审计**:每次编辑都有 Diff + 验证分数变化
|
||||
- **可回滚**:拒绝缓冲防止重复失败方向
|
||||
|
||||
## 与 AGI 的关系
|
||||
|
||||
> "这不是 AGI,甚至离 AGI 还有很远。但它是通往'更具自主性的 AI 系统'的一步扎实的脚印。"
|
||||
|
||||
## 相关
|
||||
|
||||
- [[skillopt]] — 受控自主性的技术实现
|
||||
- [[held-out-validation-gate]] — 验证门(受控的"司法者")
|
||||
- [[textual-learning-rate]] — 编辑约束(受控的"边界")
|
||||
Reference in New Issue
Block a user