57 lines
1.9 KiB
Markdown
57 lines
1.9 KiB
Markdown
---
|
||
title: "Text vs Weight Optimization (文本 vs 权重优化)"
|
||
created: 2026-05-29
|
||
updated: 2026-05-29
|
||
type: concept
|
||
tags: ["optimization", "text-space", "weight-space", "philosophy"]
|
||
sources: ["https://mp.weixin.qq.com/s/s__fdyXQG932SavQeeugcw"]
|
||
---
|
||
|
||
# Text vs Weight Optimization (文本 vs 权重优化)
|
||
|
||
**Text vs Weight Optimization** 是吕明在对 [[yang-skillopt-2026|SkillOpt]] 的深度解读中提出的核心思辨框架:[[text-space-optimizer|文本空间优化]] 与参数空间梯度下降之间,存在**表层同构但深层分野**的根本差异。
|
||
|
||
## 三个根本差异
|
||
|
||
### 1. 梯度本质
|
||
|
||
| 权重空间 GD | 文本空间 SkillOpt |
|
||
|:---|:---|
|
||
| 局部一阶偏微分向量 | 全局因果语义推理 |
|
||
| 依赖连续性 + 可微性 | LLM 对行为模式的理解 |
|
||
| 局部最陡下降方向 | 完整行为模式的因果分析 |
|
||
|
||
### 2. 验证机制
|
||
|
||
| 权重空间 | 文本空间 |
|
||
|:---|:---|
|
||
| BP 链式法则(解析严密) | 提议-验证-接受/拒绝(经验主义) |
|
||
| 梯度信号确定性传导 | 编辑因果效果非确定、统计性 |
|
||
|
||
### 3. 度量结构
|
||
|
||
| 权重空间 | 文本空间 |
|
||
|:---|:---|
|
||
| 欧氏距离 / 余弦相似度 | **无天然统一度量** |
|
||
| 几何可解释的更新大小 | 通过 Textual LR 做 Trust Region 约束 |
|
||
|
||
## 哲学隐喻
|
||
|
||
作者将其映射为两条哲学传统:
|
||
|
||
| 梯度下降 | SkillOpt |
|
||
|:---|:---|
|
||
| **英国经验主义** | **大陆理性主义** |
|
||
| 参数被动被数据塑形 | Optimizer 主动理性演绎 |
|
||
| 局部、随机、数据驱动 | 全局、意图、因果导向 |
|
||
|
||
## 启示
|
||
|
||
> "正因为文本空间不具备连续空间的分析性质,SkillOpt 采用的'优化器提议 + 验证集筛选'范式,实际上是一种利用 LLM 语义推理能力来弥补离散空间缺乏解析梯度信号的优雅方案。"
|
||
|
||
## 相关
|
||
|
||
- [[text-space-optimizer]] — 文本空间优化范式
|
||
- [[skillopt]] — SkillOpt 方法
|
||
- [[lyu-skillopt-deep-dive-2026]] — 原始文章
|