20260617:目前有914 页

This commit is contained in:
2026-06-17 15:02:40 +08:00
parent e96b955fda
commit 91fac5b6fc
423 changed files with 20687 additions and 34 deletions

View File

@@ -0,0 +1,76 @@
---
title: "窃取无穷的数学家 — 康托尔与狄德金的隐秘合作"
created: 2026-06-07
updated: 2026-06-07
type: article
source: "Quanta Magazine / 环球科学 2026年6月刊"
tags: [数学史, 集合论, 无穷, 学术伦理]
---
# 窃取无穷的数学家
> 原文发表于 Quanta Magazine2026年由《环球科学》翻译。本文揭示了一段尘封150年的数学史真相。
## 一句话总结
新发现的信件证明康托尔1874年那篇奠定集合论的里程碑论文中隐藏了狄德金的关键贡献——代数数可数性证明。康托尔抹去了合作痕迹独自署名发表。
## 核心故事
### 背景:无穷的禁忌
19世纪前数学家视无穷为"毒瘤"。高斯称之为"修辞手法"façon de parler。无穷不能在数学中真正存在。
### 1872年的突破
康托尔和狄德金各自独立定义了实数——证明了数轴是完备的连续统,无穷"隐匿在每一处缝隙中"。
### 盖尔绍的友谊
1872年夏两人在瑞士盖尔绍湖畔相遇一见如故。康托尔27岁豪爽急躁狄德金40岁内敛审慎——这对奇怪的组合成为挚友。
### 1873年的合作
康托尔在探索无穷问题时频繁请教狄德金。狄德金回信提供了代数数可数性的证明及其简化版。康托尔在此基础上补充了自己的实数不可数证明。
### 1874年的"特洛伊木马"
面对反无穷派数学权威 [[leopold-kronecker|克罗内克尔]] 的威胁,康托尔精心设计:
- 选择误导性标题,只提代数数
- 把狄德金证明放在前面,作为"诱饵"
- 将革命性的实数不可数结论藏在后面
- **抹去狄德金贡献的一切痕迹**,独自署名
### 真相的浮现
- **1930年代**[[emmy-noether|埃米·诺特]] 整理狄德金遗物时发现关键信件,但选择"让信件说明一切"
- **1993年**:数学史家费雷罗斯首次公开指控康托尔
- **2025年**科学记者戈斯在哈雷大学档案中发现失踪150年的狄德金回信——直接证据终于浮出水面
## 数学意义
康托尔和狄德金的共同工作奠定了 [[infinity-hierarchy|无穷层级体系]] 的基础:
1. [[algebraic-numbers-countability|代数数可数]] — 狄德金证明
2. 实数不可数 — 康托尔证明
3. 结论:存在不同大小的无穷
## 历史反思
> "每一门科学分支都需要一位英雄……但这种故事总是谎言。" — 何塞·费雷罗斯
- 康托尔的声誉并未因此受损——他仍是实数不可数性这一更深层发现的首位证明者
- 狄德金长期处于历史阴影中,至今无英文传记
- 承认狄德金的贡献,让数学史更加完整和真实
## 相关概念
- [[georg-cantor|格奥尔格·康托尔]]
- [[richard-dedekind|里夏德·狄德金]]
- [[infinity-hierarchy|无穷层级体系]]
- [[countable-uncountable-infinity|可数与不可数无穷]]
- [[algebraic-numbers-countability|代数数的可数性]]
- [[emmy-noether|埃米·诺特]]
- [[leopold-kronecker|利奥波德·克罗内克尔]]
- [[mathematical-priority-disputes|数学优先权争议]]
- [[set-theory-history|集合论史]]

View File

@@ -0,0 +1,76 @@
---
title: "LeCun 论 LLM 的边界与未来架构"
created: 2026-06-08
updated: 2026-06-08
type: article
tags: [LLM, JEPA, world-model, VLA, objective-driven-AI, LeCun, representation-collapse, SIGReg, Tapestry]
sources: [https://mp.weixin.qq.com/s/Zau10ioTWzhj0KOImpasNg]
---
# LeCun 论 LLM 的边界与未来架构
> 原文: Datawhale 干货 | 作者: 徐虎、李盛康、蒋银河、黎又榛
> 来源: [原始存档](raw/articles/lecun-llm-boundary-future-2026.md)
## 一句话
**智能不是关于预测下一个 token而是关于预测行动的后果。** 这篇文章系统梳理了 LeCun 对 LLM 未来方向的判断LLM 不会消失但需要"降职"[[jepa|JEPA]] 世界模型 + [[objective-driven-ai|目标驱动AI]] 才是通向通用智能的正确架构。
## 核心论点
1. **LLM 的两大结构性缺陷**:缺少[[action-consequence-prediction|预测行动后果的能力]]、缺少[[multi-step-planning|基于搜索的多步规划]]——这些不是数据量或模型规模能修复的。
2. **[[vla-vision-language-action|VLA]] 路线已接近失败**:可靠性不足、数据成本过高、泛化脆弱、无规划能力。但产业界因其工程成熟度仍在押注。
3. **[[jepa|JEPA]] 是核心解决方案**:在抽象表征空间中做预测(而非像素或 token 空间),[[leworldmodel|LeWorldModel]] 用 SIGReg 防[[representation-collapse|表征坍缩]],将防坍塌从工程启发式转化为数学上的分布匹配问题。
4. **[[objective-driven-ai|目标驱动AI]] 提供内生安全**:行为通过优化代价函数驱动,安全约束"从构造上无法违反"——区别于 RLHF 等事后软约束。
5. **[[tapestry-federated|Tapestry]] 回应[[sovereign-ai|主权AI]]问题**:联邦训练机制,共享参数向量而非数据本身。
6. **未来三层架构**LLM语言皮层→ [[world-model-lecun|世界模型]](思考引擎)→ 目标驱动决策层(安全保障)。
## 关键概念网络
```
LLM 局限性
├── 数据瓶颈 → [[data-wall]], [[model-collapse|模型崩塌]]
├── 结构性缺陷
│ ├── [[action-consequence-prediction|预测行动后果]]
│ └── [[multi-step-planning|多步规划]]
└── 安全性 → [[objective-driven-ai|目标驱动AI]]
VLA 路线
├── 可靠性 → [[vlatest]], [[libero-plus]]
├── 泛化 → [[distribution-shift|分布外泛化]]
└── 替代方案 → [[jepa|JEPA]] + [[world-model-lecun|世界模型]]
JEPA 技术栈
├── [[abstract-representation-space|抽象表征空间]]
├── [[representation-collapse|表征坍缩]] 防范
│ ├── [[vicreg|VICReg]] (方差-协方差)
│ ├── [[sigreg|SIGReg]] (各向同性高斯)
│ └── BYOL/DINO (蒸馏方法)
├── [[leworldmodel|LeWorldModel]]
└── 应用 → [[world-model-industrial|工业过程控制]]
开源生态
├── [[tapestry-federated|Tapestry 联邦训练]]
└── [[sovereign-ai|主权AI]]
```
## 核心洞察
- **LLM 的成功恰恰是它的局限所在**:离散 token + 可计算预测目标让 LLM 强大,但也锁死了它的能力边界——真实世界不是有限离散符号。
- **水瓶类比的深层含义**:像素空间的不可约不确定性意味着,预测必须在语义空间中发生——这不是工程选择,是信息论上的必然。
- **表征坍缩是自监督学习的"元问题"**:它暴露了模型天然"偷懒"倾向与信息承载需求之间的根本张力。
- **目标驱动AI vs LLM 的根本差异**:前者是架构上的"不可能做坏事"(硬约束),后者是概率上的"不太可能做坏事"(软约束)。
## 阅读导航
- 了解 JEPA 技术细节 → [[jepa]]
- 了解世界模型理论 → [[world-model-lecun]]
- 了解 VLA 为何失败 → [[vla-vision-language-action]]
- 了解表征坍缩与解决方案 → [[representation-collapse]] → [[sigreg]]
- 了解安全的替代路径 → [[objective-driven-ai]]
- 了解开源生态布局 → [[tapestry-federated]], [[sovereign-ai]]

View File

@@ -0,0 +1,83 @@
---
title: "Pydantic 三件套:从校验库到 AI 基础设施"
created: 2026-06-10
updated: 2026-06-10
type: article
tags: [pydantic, agent, observability, open-telemetry, validation]
sources: [raw/articles/pydantic-three-piece-suite-2026.md]
---
# Pydantic 三件套:从校验库到 AI 基础设施
> 微信公众号 | 2026年
> Pydantic 不只是 BaseModel——Rust 验证引擎 + OTel 可观测平台 + 类型安全 Agent 框架
## TL;DR
- [[pydantic]] 生态三层:[[pydantic-core|Rust 引擎]] + [[logfire|Logfire 可观测]] + [[pydantic-ai|Pydantic AI Agent 框架]]
- **strict + forbid + frozen 三配置零成本立即生效**
- Logfire 四行代码接入debug 从半天降到分钟级
- Pydantic AI 让类型系统约束 Agent 行为,而非仅事后校验
## 核心问题
LLM 时代的校验需求已经变了。人填的表单错误模式稳定LLM 输出的 JSON 错误模式**漂移**——同样的 prompt 跑 100 次,第 1 次可能字段名少了条下划线,第 47 次可能多了个字段,第 89 次可能把 str 塞了 None。
传统的 BaseModel 只能告诉你「第 47 次错了」,但你需要的是 [[drift-detection|漂移检测]]——哪个字段一直在漂哪个模型输出最不稳定token 成本是不是偷偷在涨?
## 三件套全景
| 层 | 解决的问题 | 不用的话 |
|---|-----------|---------|
| [[pydantic-core|pydantic-core (Rust)]] | 校验速度 / 脱离 GIL | 多线程校验串行 |
| [[logfire|Logfire (OTel)]] | 可观测 / 成本监控 / 漂移检测 | 只知"第 47 次错" |
| [[pydantic-ai|Pydantic AI]] | Agent 行为约束 / 类型安全 tool 调用 | 手写 JSON Schema + 事后校验 |
三层独立,共享同一套类型定义。可任意叠加。
## 第一件pydantic-core
Rust 写的物理引擎,通过 PyO3 绑定。`model_validate(data)` 的实际路径Python → CoreSchema JSON → Rust 层逐字段校验 → 返回。**步骤 2-4 全部在 Rust 侧完成,不走 GIL**。配合 `asyncio.gather()` 并发调 20 个 LLM API 时,每个回复的 JSON 解析可在不同线程并行跑 Rust 校验。
**[[typeadapter|TypeAdapter]]**同一份数据不同严格度——API 入口用 strictAgent 内部传递用宽松,不用写两套模型。
**三个零成本配置**
```python
model_config = {
"strict": True, # 空字符串不会变 0类型不匹配直接炸
"extra": "forbid", # LLM 多塞字段立刻报错
"frozen": True, # 模块间传递不可篡改
}
```
## 第二件Logfire
基于 [[open-telemetry|OpenTelemetry]] 标准的可观测平台。核心价值:
- **4 行代码**拿到完整 Agent span 树(根 → model request → tool 调用 → follow-up
- **OTel 标准**:数据不锁定厂商,可自托管或导出到 Grafana/Jaeger
- **SQL 查询 trace**:不是点按钮过滤,是写 SQL 查 [[drift-detection|漂移趋势]]
真实案例Sophos 安全团队发现 Agent 调用某个 tool 的频率从每 50 次推理 1 次涨到每 8 次 1 次——传统日志只看调用成功与否Logfire 的 SQL 查询揭示了频率异常。
## 第三件Pydantic AI
把 Pydantic 的类型系统直接嵌入 Agent 运行时——类型从"报错器"变成"编译器",在运行时之前就约束了 Agent 的行为空间。
- `@agent.tool` 自动从函数签名推断 tool schema不需手写 JSON Schema
- `result.data` 类型安全IDE 补全可用
- 多步 Agent 支持(多次推理 + 多次 tool 调用)
- `instrument=True` 自动接 Logfire trace
与 Instructor 的定位差异:单次 LLM 结构化输出 → Instructor多步推理 + 多 tool 调用的 Agent → Pydantic AI。
## 渐进路线图
1. **今天 (5min)**:所有 BaseModel 加 `strict=True, extra='forbid', validate_default=True`
2. **这周**:有 Agent 就加 Logfire4 行代码
3. **下次新 Agent 项目**tool > 3 就试 Pydantic AI
## 参考
- [[agent-observability|Agent 可观测性]]
- [[type-safety-in-agents|Agent 类型安全]]
- [原始存档](raw/articles/pydantic-three-piece-suite-2026.md)

View File

@@ -0,0 +1,83 @@
---
title: "金融行业大模型落地实践:从知识工程到后训练部署"
created: 2026-06-14
updated: 2026-06-14
type: article
tags: [finance, llm-deployment, knowledge-engineering, post-training, agent]
sources: [raw/articles/qifu-llm-finance-practice-2026.md]
confidence: high
---
# 金融行业大模型落地实践
> 奇富科技 DeepBank 王元在 2026 DA 上海站的分享 — DataFun 出品
**核心主张:** 在专业领域,"通用大模型 + 高质量知识工程"的路径比盲目预训练垂类大模型更具商业价值。
## 冰山难题:三重落地阻碍
金融行业面临 LLM 落地的独特困境:
1. **[[zero-data-cold-start|零数据困境]]** — 输入 X 和标签 Y 都不存在,连监督微调都无法启动
2. **评估盲区** — 生成式输出的营销策略推荐缺乏标准答案
3. **算力与合规壁垒** — 必须本地化部署,受限硬件预算和延时要求
## 知识工程
### REER 逆向知识提炼
如何从仅有的 QA 对中提取可复用的知识?借鉴字节跳动的 REER 算法,[[reer-reverse-knowledge-extraction|四步流程]]
1. 大模型逆向分析 X→Y 关系,生成推理轨迹
2. 剥离"内心独白",提取通用话术逻辑 → SUM
3. 按业务分类聚合 → 行动手册
4. 迭代优化Perplexity 下降 + 端到端坐席回复相似度验证
### 多维合成数据
[[multi-dimensional-synthetic-data|三维度构建训练数据多样性]]
- 企业客户多样性(行业资产、贸易特征、资金状况)
- 录音场景多样性(噪音层级、纯闲聊、对抗负样本)
- 录制人多样性(谨慎新手 vs 老练资深经理)
## 后训练策略
### 成本博弈
| 方案 | 成本 | 适用场景 |
|------|------|---------|
| SFT 微调 | 低 | 结构化任务、指令遵循 |
| [[post-hoc-reasoning-rl|后置推理 RL]] | 中 | 追求可解释性,无需拒绝采样 |
| [[pre-hoc-reasoning-rl|前置推理 RL]] | 高 | 正统 RL需 Dense 模型 |
### [[moe-lora-toolchain-conflict|MOE + LoRA 工具链冲突]]
VeRL 框架不支持 MOE 模型的 RL+LoRA 后训练,部分场景被迫退回全参微调。
### [[automatic-prompt-optimization|APO 自动提示工程]]
- System prompt 不宜过长User prompt 约束力更强
- Batch 处理更新APO 本质是蒙特卡洛过程
- Trace 可优化函数、提示词、工具描述
- 验证集维护帕累托前沿
## 推理与评估
### [[emotional-value-evaluation|情绪价值评估]]
在金融科技项目中,"情绪价值"往往先于业务效果被感知。引入心理学方法构建评估器:先提供"看着像"的情绪价值,再追求成功率。
### 推理加速
MOE 架构在吞吐量上有明显优势。任务卡数多于模型数时,多个 Int8 量化 Merge 模型收益可能高于 1 个基模挂多个 LoRA。
## 相关概念
- [[reer-reverse-knowledge-extraction|REER 逆向知识提炼]] — 从 QA 对中反向提取业务手册
- [[multi-dimensional-synthetic-data|多维合成数据]] — 零数据场景的训练数据构建
- [[post-hoc-reasoning-rl|后置推理 RL]] — 性价比更高的推理方案
- [[pre-hoc-reasoning-rl|前置推理 RL]] — 正统但昂贵的 RL 路径
- [[automatic-prompt-optimization|APO 自动提示工程]] — 高质量 Base Prompt 基线生成
- [[emotional-value-evaluation|情绪价值评估]] — LLM 在业务中的主观质量度量
- [[moe-lora-toolchain-conflict|MOE + LoRA 工具链冲突]] — 后训练的现实阻碍
- [[zero-data-cold-start|零数据冷启动]] — X 和 Y 都缺失的极端场景
- [[vertical-llm-knowledge-engineering|垂域 LLM 知识工程]] — 通用模型 + 领域知识的落地范式

View File

@@ -0,0 +1,46 @@
---
title: "4D 高斯泼溅 (4D Gaussian Splatting)"
created: 2026-06-13
updated: 2026-06-13
type: concept
tags: [computer-vision, 3d-reconstruction, gaussian-splatting, dynamic-scenes]
sources: [raw/papers/cheng-flex4dhuman-2026.md]
---
# 4D 高斯泼溅 (4D Gaussian Splatting / 4DGS)
3D Gaussian Splatting (3DGS) 的时间扩展——用一组随时间变化的高斯基元表示动态场景,支持任意时间步和任意视角的可微分渲染。
## 从 3DGS 到 4DGS
- **3DGS**:静态场景的一组 3D 高斯基元,每个基元具有位置、协方差、颜色和不透明度
- **4DGS**:基元增加时间维度——位置/协方差/颜色可随时间变化,形成"动态高斯泼溅"
- **核心思想**:不显式建模运动场(如 NeRF + 变形场),而是直接优化基元的时间演变
## 在 Flex4DHuman 中的角色
Flex4DHuman 生成的同步多视角视频作为 4DGS 的输入数据,取代了传统"多相机采集设备"的需求:
1. **生成多视角视频**:模型生成所有目标视角的同步帧
2. **拟合 4DGS**:使用 FreeTimeGS 从多视角帧优化动态高斯泼溅
3. **自由视点渲染**:拟合后的 4DGS 可在任意时间/视角渲染新图像
## 使用的工具
- **FreeTimeGS**Wang et al., CVPR 2025Flex4DHuman 选用的具体 4DGS 重建方法
- **SparkJS**:基于 Three.js 的 3DGS 浏览器渲染器,支持实时交互
- **Marble**World Labs多模态世界模型可将重建的 4DGS 角色组合到生成场景中
## 与其他动态表示对比
| 方法 | 代表工作 | 优势 | 劣势 |
|------|---------|------|------|
| NeRF + 变形场 | D-NeRF, HumanNeRF | 连续性 | 训练慢,渲染慢 |
| 3DGS + 变形 | 3DGS-Avatar | 实时渲染 | 需显式变形模型 |
| **4DGS** | 4D-GS, FreeTimeGS | 实时渲染,无变形场 | 高斯基元数较多 |
## 参考
- [[monocular-video-to-4d|单目视频到 4D]] — Flex4DHuman 的完整 4D 管线
- [[flex4dhuman|Flex4DHuman]] — 多视角视频的生成源
- [[freetimegs|FreeTimeGS]] — 使用的具体方法

View File

@@ -0,0 +1,43 @@
---
title: "溯因推理 (推荐) — Abductive Reasoning in Recommendation"
created: 2026-06-10
updated: 2026-06-10
type: concept
tags: [reasoning, recommendation, logic, abduction]
sources: [raw/papers/onereason-team-onereason-2026.md]
---
# 溯因推理 (推荐) — Abductive Reasoning
> 推荐推理的本质是溯因 (Abduction) 而非演绎 (Deduction)——从观察到的行为反推不可观测的用户意图。
## 溯因 vs 演绎 vs 归纳
| 推理类型 | 模式 | 经典任务 |
|---------|------|---------|
| 演绎 (Deduction) | 规则 + 前提 → 必然结论 | 数学证明、代码生成 |
| 归纳 (Induction) | 多个实例 → 一般规则 | 模式识别、分类 |
| 溯因 (Abduction) | 观察结果 → 最可能的原因 | **推荐推理**、医疗诊断 |
## 为什么推荐是溯因推理
1. **用户意图不可观测**:真实兴趣永远隐藏在行为背后
2. **行为是结果,不是原因**:点击/观看是兴趣的外显,不是兴趣本身
3. **多因一果**:同一行为可能对应多种兴趣
4. **时序演化**:兴趣随时间漂移,历史中混杂了新旧偏好
## 推荐 CoT 的溯因结构
一个好的 [[recommendation-cot|推荐 CoT]] 应该:
1. 从历史 [[itemic-tokens|itemic token]] 序列中选择相关行为
2. 假设潜在兴趣点(溯因跳跃)
3. 将兴趣压缩为可解释的偏好
4. 建模兴趣间的时间演化
5. 用推断的偏好状态来论证推荐
## 参考
- [[recommendation-reasoning|推荐推理]]
- [[recommendation-cot|推荐 CoT]]
- [[perception-cognition-recommendation|感知-认知推荐层次]]
- [[onereason|OneReason]]

View File

@@ -0,0 +1,54 @@
---
title: "绝对门控与相对门控 (Absolute vs Relative Gating)"
created: 2026-06-17
updated: 2026-06-17
type: concept
tags: [architecture, sparse-autoencoder, gating-mechanism]
sources: [raw/papers/zhang-geometric-sae-2026.md]
confidence: high
---
# 绝对门控与相对门控 (Absolute vs Relative Gating)
[[geometric-sae-concepts|Zhang et al. (2026)]] 提出的 [[sparse-autoencoder|SAE]] 架构分类——门控机制的本质差异决定了 SAE 的几何性质和可分析性。
## 绝对门控 (Absolute Gating)
每个神经元的激活**仅由自身预激活值决定**
- **ReLU SAE**`a_i = max(0, z_i)`,激活区域 = 半空间 `H_i^+`
- **Gated SAE**:引入额外门控网络
- **JumpReLU SAE**`a_i = z_i · 1[z_i > τ_i]`
**几何性质**
- 神经元激活区域 `N_i = H_i^+`(精确等于半空间)
- 多神经元单元的激活区域 = 半空间的交集(凸多面体)
- 理论分析直接、条件简单
## 相对门控 (Relative Gating)
神经元的激活**依赖于与其他神经元的比较**
- **Top-K SAE**:仅保留 k 个最大 z_i
- **Matching Pursuit SAE**:迭代选择贡献最大的
- **SPaDE**:结构化选择
**几何性质**
- `N_i ⊆ H_i^+`(仅半空间的子集)
- N_i 是超平面排列区域的并集(复杂非凸形状)
- 即使 `z_i > τ_i`,若未进入 Top-K 也不激活
## 几何差异的后果
| 性质 | 绝对门控 | 相对门控 |
|------|---------|---------|
| 激活区域 | 半空间(凸) | 多胞体并集(非凸) |
| 概念分离条件 | Conv(C) ∩ Conv(N) = ∅ | 更复杂 |
| 稀疏性 | L1 正则化(软约束) | k 硬约束 |
| 层级概念 | 天然支持(子概念激活不排斥父概念) | 竞争排斥 |
## 参考
- [[sparse-autoencoder|SAE]]
- [[hyperplane-arrangements|超平面排列]]
- [[geometric-sae-concepts|几何框架论文]]

View File

@@ -0,0 +1,48 @@
---
title: "抽象表征空间 (Abstract Representation Space)"
created: 2026-06-08
updated: 2026-06-08
type: concept
tags: [representation-learning, JEPA, LeCun, world-model, information-theory]
sources: [raw/articles/lecun-llm-boundary-future-2026.md]
---
# 抽象表征空间 (Abstract Representation Space)
[[jepa|JEPA]] 架构中执行预测和规划的核心空间。区别于像素空间、token 空间,是对世界状态的语义级压缩表征。
## 为什么必须在抽象空间?
### 信息论论证
- 像素空间:$H(pixel|context)$ 极高——即便给定充分上下文,像素取值仍高度不确定
- 语义空间:$H(state|context)$ 相对低且结构化——提供可靠预测的稳定着力点
### 维度对比
- 256×256 RGB 像素:**196,608 维**
- LeWorldModel 潜在表示:**192 维**~1000× 压缩)
在抽象空间做预测,模型算力集中于因果结构,而非纹理、光照、阴影、水面折射等对决策无用的细节。
### 与 token 空间的区别
| 维度 | Token 空间 | 抽象表征空间 |
|------|-----------|------------|
| 搜索方式 | 离散符号枚举 | 连续向量优化 |
| 物理世界适用性 | ❌ 行动空间连续高维不可枚举 | ✅ 不依赖离散符号可枚举性 |
| 规划性质 | "哪段话听起来合理" | "走这条路会到哪里" |
## LeCun 的表述
> "我在 JEPA 中谈的是,你不是在词元空间里做这件事,而是在抽象思维空间里做。"
## 认知科学对应
人类在想象"推水瓶"时,直觉物理工作在抽象的、去噪的、以物体为中心的表征层——你知道"瓶子会倒",但大脑不生成瓶身每个反光点的精确 RGB 值。JEPA 正是对这一生物直觉的工程模拟。
## 来源
- [[lecun-llm-boundary-future|原始文章]]
- [[jepa|JEPA]]
- [[world-model-lecun|LeCun 世界模型]]

View File

@@ -0,0 +1,43 @@
---
title: "预测行动后果 (Action Consequence Prediction)"
created: 2026-06-08
updated: 2026-06-08
type: concept
tags: [intelligence, planning, world-model, LeCun, agent]
sources: [raw/articles/lecun-llm-boundary-future-2026.md]
---
# 预测行动后果 (Action Consequence Prediction)
智能系统应具备的核心能力之一,也是 LeCun 认为 LLM **缺失**的第一大能力。
## 为什么如此关键?
> "智能的本质不是反应,而是选择。"
一个系统如果无法预判"做了这件事之后会发生什么",只能被动响应当前输入,无法主动权衡和制定策略。没有这个能力,"行动"不过是刺激与反应之间的映射,和反射弧没有本质区别。
## 神经科学视角
- 发表在 *Nature Neuroscience* 的研究:**大脑本质上是一台预测机器**,而非反应机器
- 处理感官信号需几百毫秒,而世界不会等你——大脑必须提前下注,用预测跑在现实前面
- 流程:在内部持续模拟"行动→后果"循环,用预测指导行动,用感知校正预测
## LLM 的根本差距
- LLM **没有内部模拟器**
- 它描述行动后果的能力来自训练数据里人类写下的经验,而非自己模拟出来的现实
- 上一个 token 的影响和下一个 token 的预测之间,基本没有反馈回路
## LeCun 的解决方案
[[jepa|JEPA]] + [[world-model-lecun|世界模型]]:整个预测过程发生在行动之前,先在内部模拟,而非盲目试错。
预测行动后果是[[multi-step-planning|多步规划]]的前提——没有世界模型告诉系统"走这条路会到哪里",搜索只能盲目试错。
## 来源
- [[lecun-llm-boundary-future|原始文章]]
- [[multi-step-planning|多步规划]]
- [[jepa|JEPA]]
- [[world-model-lecun|LeCun 世界模型]]

View File

@@ -0,0 +1,47 @@
---
title: "动作解码器 (Action Decoder)"
created: 2026-06-17
updated: 2026-06-17
type: concept
tags: [reinforcement-learning, mdp, optimization, operations-research]
sources: [raw/papers/chen-bellman-taylor-score-2026.md]
confidence: high
---
# 动作解码器 (Action Decoder)
动作解码器是 [[bellman-taylor-score-decoding|BTSD]] 框架的核心组件——将**无约束欧氏得分向量 z 映射为原始 MDP 中的可行动作 a**,通过求解优化问题实现。
## 定义
```
Γ(s, z) ∈ argmax_{a∈A(s)} [ψ_s(a) + ⟨z, φ_s(a)⟩]
```
其中 `φ_s(a)` 是后动作配置表示,`ψ_s(a)` 是即时奖励z 是策略学到的边际价值得分。
## 核心作用
1. **可行性保证**:输出始终在 A(s) 内,精确满足操作约束
2. **学习-可行性分离**:策略只负责输出 z约束处理完全外置
3. **无需梯度**:解码器仅在 MDP 交互的前向传播中使用,策略梯度不涉及解码器的导数
4. **结构感知**:优化问题编码了运筹学领域的结构知识(线性/整数规划等)
## 与 differentiable optimization 的区别
| 维度 | Differentiable Opt | Action Decoder |
|------|-------------------|----------------|
| 角色 | 可训练层 | 固定前向映射 |
| 梯度 | 需反向传播 | 不需求导 |
| 训练 | 端到端梯度 | 策略梯度REINFORCE |
| 组合动作 | 难以处理 | 可直接支持 |
## 计算代价
每次动作选择需要求解一个优化问题——这是 BTSD 相对于直接参数化策略的主要额外开销。但许多 OR 问题的优化问题高度结构化,可被高效求解。
## 参考
- [[bellman-taylor-score-decoding|BTSD]]
- [[latent-score-mdp|潜在得分 MDP]]
- [[state-dependent-feasible-action-sets|状态依赖可行动作集]]

View File

@@ -0,0 +1,51 @@
---
title: "动作头路由器 (Action Head Router)"
created: 2026-06-17
updated: 2026-06-17
type: concept
tags: [architecture, routing, reinforcement-learning]
sources: [raw/papers/zhang-tarpo-2026.md]
confidence: high
---
# 动作头路由器 (Action Head Router)
动作头路由器是 [[tarpo|TARPO]] 框架中的**轻量级路由决策模块**——一个附加在 LLM 骨干上的线性投影层,用于在每一步决定推理模式。
## 结构
```
rho(h_t) = Softmax(W_r * h_t + b_r)
```
- `h_t ∈ R^d`Transformer 最后一层隐藏状态
- `W_r ∈ R^{2×d}`:将 d 维隐藏状态投影到 2 维hard/soft 概率)
- `b_r ∈ R^2`:偏置项,初始化对训练有关键影响
这就是全文最 "lightweight" 的部分——仅 `2d + 2` 个参数。
## 初始化策略
偏置 `b_0` 的初始化影响模型对 hard/soft 的初始偏好:
- `b_0 = [2.2, 0]`:偏向 hard → 保守起点soft 比率随训练逐渐上升
- `b_0 = [0.85, 0]`:较均衡 → 早期就有较多 soft token
- 默认采用轻度 hard 偏好,与模型的自然倾向一致
## 训练与推理
- **训练时**:从 `ρ_θ` 采样路由决策,鼓励结构探索
- **推理时**:支持随机和确定性两种路由策略
## 与 LLM 骨干的关系
动作头是**最小侵入性**的——它不改变 Transformer 架构,仅读取最后一层隐藏状态作为输入。这种解耦设计使得:
1. 可轻松适配不同规模的 LLM
2. 路由决策和 token 生成使用共享的 advantage 信号联合优化
3. 训练稳定,不会干扰骨干的预训练知识
## 参考
- [[action-routing-policy|动作路由策略]]
- [[token-wise-routing|逐token路由]]
- [[tarpo|TARPO]]

View File

@@ -0,0 +1,40 @@
---
title: "Action Realization Layer动作实现层"
created: 2026-06-11
updated: 2026-06-11
type: concept
tags: [agent, harness, action-validation, execution]
sources: [raw/papers/xu-life-harness-runtime-adaptation-2026.md]
---
# Action Realization Layer
> Life-Harness 的第③层:在模型输出动作之后、环境执行之前,基于确定性环境证据进行**可执行性验证和规范化**,阻断确定会失败的动作。
## 机制
```
z_t = REALIZE_ACTION(a_t, τ_t, s_t)
z_t ∈ {EXEC(a_t), BLOCK(m_t)}
```
该层接收模型的原始动作 a_t 和当前轨迹/状态上下文,利用**确定性的环境证据**tool schema、合法动作集、参数约束、任务策略判断 a_t 是否合法可执行:
- 若合法 → 规范化后提交给环境执行
- 若不合法 → 返回阻塞消息 m_t 给模型,阻止无效调用消耗环境步骤配额
## 为什么关键
在 Life-Harness 的失败诊断中,**动作实现失败Action Realization Failure**占约 23%——模型的**意图本身合理**,但表达格式不符合环境的执行要求(如自由文本代替结构化 tool call、参数缺失或类型错误。这些问题在确定性的规则环境下完全可被检测和阻断——不需要更强的模型推理能力。
## 设计原则
- **确定性验证**:只使用可程序化验证的环境约束,不做模糊语义判断
- **规范化**:将合法但格式松散的动作转为标准格式
- **即时反馈**:阻塞消息让模型立即修正,避免浪费后续步骤
## 参考
- [[xu-life-harness|Life-Harness 论文]]
- [[environment-contract-layer|环境契约层]]
- [[trajectory-regulation-layer|轨迹调控层]]
- [[deterministic-agent-failures|确定性 Agent 失败分类]]

View File

@@ -0,0 +1,59 @@
---
title: "动作路由策略 (Action-Routing Policy)"
created: 2026-06-17
updated: 2026-06-17
type: concept
tags: [reinforcement-learning, routing, policy-gradient]
sources: [raw/papers/zhang-tarpo-2026.md]
confidence: high
---
# 动作路由策略 (Action-Routing Policy)
动作路由策略是 [[tarpo|TARPO]] 框架中将**推理模式选择形式化为 RL 策略**的核心抽象。
## 形式化定义
将推理模式选择建模为二元离散动作空间 `D = {hard, soft}` 上的随机策略:
```
ρ_θ(d_t | h_t) = Softmax(W_r * h_t + b_r)
```
其中 `W_r ∈ R^{2×d}``b_r ∈ R^2` 是 [[action-head-router|动作头]] 的可训练参数。
## 策略优化目标
路由策略与 LLM 骨干共享 group-relative advantage 信号:
```
L_act = -(1/T) * sum_{t=1}^{T} log ρ_θ(d_{i,t} | h_{i,t}) * A_hat_i
```
- 当 advantage 为正时,鼓励当前路由决策
- 当 advantage 为负时,惩罚当前路由决策
- 通过 λ 超参数控制路由目标在总损失中的权重
## KL 正则化
为保证训练稳定性,对路由策略施加 KL 惩罚:
```
L_KL = sum_t [δ_t * D_KL(π_θ || π_ref) + α * D_KL(ρ_θ || ρ_ref)]
```
- `δ_t = ρ_θ(Hard | h_t)`:只在 hard 模式下施加 token 级 KL
- α 控制路由策略 KL 的强度
## 关键特性
- **可学习**:完全通过 RL 优化,无需预设启发式阈值
- **随机性保留**:从策略采样(而非 argmax保证探索
- **初始化敏感性**:初始偏置 `b_0` 影响 soft 比率和训练 reward 动态
## 参考
- [[action-head-router|动作头路由器]]
- [[token-wise-routing|逐token路由]]
- [[tarpo|TARPO]]
- [[grpo|GRPO]]

View File

@@ -0,0 +1,49 @@
---
title: "Activation Manifold"
created: 2026-06-01
updated: 2026-06-01
type: concept
tags: [steering, interpretability, representation-geometry]
sources: [raw/papers/xu-why-steering-works-2026.md]
---
# Activation Manifold激活流形
## 定义
激活流形假说Xu et al., 2026认为LLM 中间层的激活集中在训练过程中自然形成的低维流形 $M_l \subset \mathbb{R}^{d_l}$ 上或其附近。
**形式化**Assumption 4.1
$$\Pr_{x \sim X_{\text{stable}}} [d(h_l(x), M_l) \leq \epsilon] \geq 1 - \delta$$
对稳定处理的输入,激活以高概率靠近 $M_l$。
## 流形偏离与效用退化
这是理解 preferenceutility 折衷的**关键机制**
- 导向干预将激活沿偏好方向平移:$\tilde{h}_l(m) = h_l + m \Delta h$
- 小幅平移(|m| 小):激活仍靠近流形,行为可被下游层正确解码 → 定向调整行为
- 大幅平移(|m| 大):激活偏离流形的高密度区域 → 表示-解码器失配 → **效用崩溃**
## 有效性衰减函数
使用 Rational Quadratic (RQ) 衰减建模 $D(m)$——偏离流形距离的平滑衰减:
$$D(m) = \begin{cases} [1 + (m-m_+)^2/L_+]^{-p_+} & m \geq 0 \\ [1 + (m-m_-)^2/L_-]^{-p_-} & m < 0 \end{cases}$$
- $m_\pm$导向轨迹与流形邻域的交点
- $L_\pm$衰减特征尺度方向与流形平行时大切割流形时小
- $p_\pm$衰减速率
## 理论意义
将导向控制的质量退化**从经验现象提升为几何可预测的机制**偏好由投影增益决定效用退化由偏离流形决定
## 相关概念
- [[validity-decay]] $D(m)$ 的详细分析
- [[representation-validity]] 表示有效性与解码可靠性
- [[steering-dynamics]] 三阶段动态的行为表现
- [[preference-utility-analysis]] 偏好-效用分析框架
- [[xu-why-steering-works]] 源论文

View File

@@ -0,0 +1,46 @@
---
title: "Activation Steering"
created: 2026-06-01
updated: 2026-06-01
type: concept
tags: [steering, interpretability, inference-time-intervention]
sources: [raw/papers/xu-why-steering-works-2026.md]
---
# Activation Steering激活导向
## 定义
激活导向是在推理时修改 LLM 中间层表示的方法,通过向选定激活添加一个导向向量:
$$h_{i+1} = W h_i + b + mv$$
其中 $v$ 是预定的方向,$m$ 是标量系数。
## 理论基础
激活导向建立在**线性表示假说** ([[linear-representation-hypothesis]]) 之上:抽象概念在表示空间中近似对应线性子空间。导向向量 $v$ 可以从概念正负样本的激活差异中提取DiffMean
## 在统一框架中
在 Xu et al. (2026) 的统一动态权重视角中,激活导向等价于仅修改偏置 b
$$h_{i+1} = W h_i + (b + m\Delta b)$$
$$\Delta h = m\Delta b$$
它是动态权重更新中**参数规模最小**(仅 $d_{out}$ 参数)的形式。
## 常见方法
- **DiffMean**Marks & Tegmark, 2023无训练从对比对中取激活差值的均值
- **SFT**:监督微调导向向量
- **RePS**:基于偏好的训练
## 相关概念
- [[dynamic-weight-updates]] — 统一框架
- [[steering-vector]] — 导向向量的提取方法
- [[linear-representation-hypothesis]] — 线性空间假设
- [[split-steering]] — 改进的向量训练方法
- [[xu-why-steering-works]] — 源论文

View File

@@ -0,0 +1,50 @@
---
title: "适配器协议 (Adapter Protocol)"
created: 2026-06-15
updated: 2026-06-15
type: concept
tags: [coding-agent, evaluation, benchmarking]
sources: [raw/papers/zheng-claw-swe-bench-2026.md]
---
# 适配器协议 (Adapter Protocol)
## 定义
Claw-SWE-Bench 中的适配器协议是一组标准化的生命周期接口,用于将异构 agent harnessclaw连接到统一的 SWE-bench 评测管道。它不需要不同 harness 使用相同的内部 agent 循环,而是标准化 harness 与 benchmark 生命周期之间的接口。
## 接口方法
每个受支持的 harness 实现五个抽象方法:
| 方法 | 职责 |
|------|------|
| `create_agent` | 创建或配置 agent 实例 |
| `send_task` | 派发实例化的任务 |
| `backup_session` | 保存运行产物 |
| `delete_agent` | 清理 harness 状态 |
| `get_docker_args` | 提供 harness 特定的 Docker 参数 |
## 设计原则
1. **职责分离:** 容器管理、prompt 实例化、patch 收集、预测写入、元数据记录由 benchmark 层统一处理
2. **最小接口:** 每个 harness adapter 仅需连接其 agent 到该生命周期
3. **Patch 来源独立:** 候选 patch 从**仓库状态**收集,而非从 agent 最终消息解析——无论 harness 输出 JSON、纯文本、自然语言还是没有结构化响应
## Full Adapter vs Bare Adapter
| | Bare Adapter | Full Adapter |
|---|---|---|
| Docker 访问 | 最小 | 完整 workspace 准备 |
| Patch 提取 | 要求模型输出 unified diff | Git diff from /testbed |
| Future-Commit 清理 | 无 | 有 |
| Apply Failed | 69.1% | <1.5% |
| Pass@1 (GLM 5.1) | 19.1% | 73.4% |
**关键洞察:** Bare adapter 的瓶颈不是模型不会编辑代码而是直接生成 unified-diff 文本的脆弱性——行号上下文hunk header尾部换行都可能导致 patch 无法 apply
## 参考
- [[claw-swe-bench|Claw-SWE-Bench 论文]]
- [[agent-harness|Agent Harness]]
- [[patch-based-evaluation|Patch-Based Evaluation]]
- [[bare-adapter|Bare Adapter]]

View File

@@ -0,0 +1,44 @@
---
title: "自适应对手 (Adaptive Adversary)"
created: 2026-06-10
updated: 2026-06-10
type: concept
tags: ["multi-agent-rl", "online-learning", "game-theory"]
sources: ["[[minimax-policy-regret-pomg]]"]
---
# 自适应对手 (Adaptive Adversary)
**自适应对手**是其行为依赖于学习者**过去策略**的对手——不同于 oblivious 对手(行为预固定、不随学习者改变)。
## 形式化
m-memory bounded 对手 R
```
g^t = R_t(pi^{t-m+1}, ..., pi^t)
```
对手在第 t 步的响应仅依赖最近 m 个 episode 的学习者策略。当学习者重复固定策略 pi 时,对手收敛到稳态响应 R_inf(pi)。
## 为什么自适应对手难处理
1. **External regret 失效**:标准 regret 将对手行为视为固定序列——在自适应对手下,如果学习者选择了不同策略,对手行为也会不同
2. **无界记忆不可能**Arora et al., 2012当对手可以无限记忆时任何算法都无法获得次线性 regret
3. **反事实推理**:评估策略 pi 需要知道"如果一直用 pi对手会怎么反应"——这需要对手响应函数的模型
## 结构条件
[[minimax-policy-regret-pomg|Arora (2026)]] 引入两类条件使自适应对手可处理:
- **有限记忆**m < infinity否则 regret 不可能次线性
- **[[posterior-lipschitz-adversary|Posterior-Lipschitz]]**响应平滑变化
- **[[fading-memory|几何衰减记忆]]**扩展——允许无限但衰减的记忆
## 参考
- [[minimax-policy-regret-pomg|Minimax-Optimal Policy Regret in POMGs]]
- [[policy-regret|Policy Regret]]
- [[posterior-lipschitz-adversary|Posterior-Lipschitz Adversary]]
- [[fading-memory|Fading Memory]]

View File

@@ -0,0 +1,38 @@
---
title: "Agent Harness Safety"
created: 2026-06-05
updated: 2026-06-05
type: concept
tags: [agent-safety, harness, trajectory-audit]
sources: [[liu-auditing-agent-harness-safety]]
---
# Agent Harness Safety
**Agent 骨架安全**是将 Agent 安全评测的对象从"模型的最终回答"转移到"执行骨架的完整轨迹"的范式。由 [[liu-auditing-agent-harness-safety|Auditing Agent Harness Safety]] 论文明确提出和系统化。
## 核心主张
> Agent safety should be evaluated on the **harness** rather than the response, and audited over the full **execution trajectory**.
一个 [[execution-harness|执行骨架]] 可以在返回正确、良性的最终答案的同时,在过程中越权访问资源、将私有上下文泄露给错误的 Agent、或触发不可逆的副作用。仅评测最终输出无法发现这些故障模式——这就是"输出级评测"的根本盲区。
## 三层安全审计
HarnessAudit 框架将骨架安全分解为三个联合评估的层次:
| 层次 | 名称 | 审计内容 |
|------|------|---------|
| L1 | [[boundary-compliance|边界合规]] | 工具/资源/信息流是否越界 |
| L2 | [[execution-fidelity|执行忠实度]] | 中间步骤有效性 + 检查点完成 |
| L3 | [[system-stability|系统稳定性]] | 扰动下 L1/L2 是否保持 |
三层必须**同时满足**才能视为安全可部署——每一层对应其他层无法检测的独特故障模式。
## 与现有 Agent Safety 的区别
传统的 [[agent-safety-evaluation|Agent 安全评测]] 主要依赖输出审核output moderation而 HarnessAudit 通过 [[hidden-audit-channel|隐藏审计通道]] 独立记录工具调用、资源访问和组件间通信,实现了与 Agent 自报无关的轨迹级证据链。
## 关键指标
[[safety-adherence-rate|安全遵守率 (SAR)]] 作为**乘法性安全门控**:只有当安全约束被满足时,任务完成和高忠实度才有意义。这确保了"快但不安全"的执行不会获得高分。

45
concepts/agent-harness.md Normal file
View File

@@ -0,0 +1,45 @@
---
title: "Agent Harness (Claw)"
created: 2026-06-15
updated: 2026-06-15
type: concept
tags: [coding-agent, evaluation, multi-agent]
sources: [raw/papers/zheng-claw-swe-bench-2026.md]
---
# Agent Harness (Claw)
## 定义
Agent Harness在 Claw-SWE-Bench 的术语中称为 **claw**)是将 LLM 包装为自主编程系统的 harness 层——包括 agent 循环、工具接口、工作空间管理、停止策略等。它不是模型本身,而是将模型的推理能力转化为可操作的代码编辑行为的**工程层**。
## 与传统 SWE-bench 评测的区别
传统 SWE-bench 评测将 prompt 模板、agent 循环、工具接口、超时、patch 提取和停止逻辑打包为单一系统报告。这导致 **三个因果独立因素的混淆**
1. 被评测的 LLM
2. 将 LLM 转化为 agent 的 harness
3. 被解决的任务实例
Claw-SWE-Bench 将 harness 提升为**受控实验变量**。
## 核心要素
一个 claw 的关键设计空间包括:
- **Agent 循环:** 如何管理多轮交互和状态
- **工具接口:** 暴露给模型的工具集文件读写、shell 执行等)
- **工作空间管理:** 容器、仓库、依赖环境
- **停止策略:** 何时判定任务完成
- **System Prompt:** 任务指令、约束条件、输出格式
## 实验证据
在 Claw-SWE-Bench 的五 claw × 双模型扫掠中:
- 固定 GLM 5.1Pass@1 从 60.9% 到 73.4%**12.5 pp 差距**
- 固定 Qwen 3.6-flashPass@1 从 38.6% 到 66.0%**27.4 pp 差距**
Harness 选择的差异可与相邻模型层级的差异相当甚至更大。
## 参考
- [[claw-swe-bench|Claw-SWE-Bench 论文]]
- [[adapter-protocol|适配器协议]]
- [[harness-model-interaction|Harness × Model 交互]]

View File

@@ -48,5 +48,9 @@ Agent 可观测性是 ETCLOVG 七层分类法中的第五层O从 Lifecy
## 相关概念
- [[etclovg-taxonomy]] — 七层分类体系
- [[lifecycle-orchestration]] — 编排层O 层从中独立)
- [[open-telemetry|OpenTelemetry (OTel)]] — 事实标准
- [[logfire|Logfire]] — Pydantic 生态的 OTel 可观测平台4 行代码接入SQL 查询 trace
- [[drift-detection|漂移检测]] — 在"第 47 次报错"前看到"第 32 次开始不对劲"
- [[agent-harness-engineering]] — 总体框架
- [[cost-quality-speed-trilemma]] — 成本维度
- [[pydantic-three-piece-suite|Pydantic 三件套]] — 从校验到可观测到 Agent 类型安全

View File

@@ -0,0 +1,50 @@
---
title: "Agent Token Budget Optimization"
created: 2026-06-05
updated: 2026-06-05
type: concept
tags: [token-economics, budget, optimization, agent]
sources: [[chen-token-economics-llm-agents]]
---
# Agent Token Budget Optimization
**Agent Token 预算优化**是 [[micro-level-token-economics|微观 Token 经济学]] 的核心方法论,研究在给定 Token 预算约束下如何最大化 Agent 输出质量。对应新古典企业理论中的**要素替代优化**问题。
## 核心公式
```
max Quality(A; T_input, T_reason, T_memory, T_tool)
s.t. Σ(T_i × p_i) ≤ Budget
```
给定预算 B在推理、记忆、工具调用等 Token 类型之间进行最优分配。
## 五大优化策略
| 策略 | 描述 | 对应 Token 类型 |
|------|------|----------------|
| **KV-Cache 共享** | 多轮对话中共享注意力缓存 | 计算 Token |
| **投机解码** | 草稿模型加速推理 | 计算 Token |
| **上下文压缩** | 摘要/关键帧选择替代完整历史 | 记忆 Token |
| **工具调用批量化** | 合并多次工具调用为一次 | 工具 Token |
| **CoT 压缩** | 减少推理步骤的冗长度 | 推理 Token |
## 两阶段优化模式
实际系统通常采用两阶段:
1. **Adaptive Budget Allocation**:根据任务复杂度动态分配初始预算
2. **Online Budget Monitoring**:执行过程中监控消耗,触发重分配或提前终止
## 预算感知 vs 预算不感知
| 模式 | 行为 | 风险 |
|------|------|------|
| 预算不感知 | Agent 无限制生成,依赖外部截断 | 关键推理被截断、"Lost in the Middle" |
| 预算感知 | Agent 在已知预算内主动优化 | 策略性压缩、质量-效率权衡 |
## 与相关概念
- [[token-efficiency|Token 效率]] 是预算优化的具体技术目标
- [[differentiable-token-budgeting|可微 Token 预算]] 是前沿方向——将预算从外生参数变为可学习参数
- [[cost-quality-speed-trilemma|三元悖论]] 中成本维度直接对应预算约束

View File

@@ -0,0 +1,34 @@
---
title: "随机不确定性 (Aleatoric Uncertainty)"
created: 2026-06-10
updated: 2026-06-10
type: concept
tags: ["uncertainty-quantification", "bayesian-deep-learning"]
sources: ["[[principled-uncertainty-clinical-ai]]"]
---
# 随机不确定性 (Aleatoric Uncertainty)
**随机不确定性**Aleatoric Uncertainty是数据本身固有的、不可减少的噪声。与 [[epistemic-uncertainty|认知不确定性]](模型知识不足)不同,它不能被更多训练数据所消除。
## 形式化定义
通过专用的不确定性输出头估计sigma^2_aleatoric = softplus(g(z))
Softplus 激活函数确保方差的非负性。
## 临床意义
- **测量噪声**:高随机不确定性可能指示传感器误差、数据录入错误或不一致的临床测量
- **内在变异性**:患者生理指标的天然波动
- **与认知不确定性的互补**:两者需要不同的临床响应策略
| 不确定性类型 | 可能的响应 |
|------------|----------|
| 高随机不确定性 | 检查数据质量、重复测量 |
| 高认知不确定性 | 触发专家审核、收集更多代表性数据 |
## 参考
- [[principled-uncertainty-clinical-ai|Principled Uncertainty in Clinical AI]]
- [[epistemic-uncertainty|认知不确定性]]
- [[uncertainty-quantification|不确定性量化]]

View File

@@ -0,0 +1,50 @@
---
title: "代数数的可数性"
created: 2026-06-07
updated: 2026-06-07
type: concept
tags: [代数, 集合论, 无穷, 数学史]
---
# 代数数的可数性
代数数集合是可数的——即代数数与自然数之间存在一一对应。这一结论最初由 [[richard-dedekind|狄德金]] 在1873年证明但在 [[georg-cantor|康托尔]] 1874年的著名论文中这一证明被康托尔以自己名义发表而未给出处。
## 什么是代数数
**代数数**algebraic number是整系数多项式方程的根。即存在整数 $a_0, a_1, \ldots, a_n$(不全为零),使得:
$$a_n x^n + a_{n-1} x^{n-1} + \cdots + a_1 x + a_0 = 0$$
例如:
- 所有有理数都是代数数(一次方程的根)
- $\sqrt{2}$ 是代数数($x^2 - 2 = 0$ 的根)
- 黄金比例 $\phi$ 是代数数($x^2 - x - 1 = 0$ 的根)
## 狄德金的证明1873年
核心思路:
1. 每个代数数对应一个整系数多项式
2. 每个多项式可以用其系数(整数元组)唯一标识
3. 所有整数的有限元组是可数的
4. 因此所有代数数也是可数的
狄德金在1873年11月30日写给康托尔的信中详细给出了这个证明这封信失踪150年后于2025年被重新发现
## 康托尔的署名争议
康托尔1874年发表于《克雷勒杂志》的论文将代数数的可数性作为"特洛伊木马"——放在论文前半部分以避开反无穷派 [[leopold-kronecker|克罗内克尔]] 的警觉。论文后半部分则是康托尔独立证明的实数不可数性。
康托尔刻意抹去了狄德金贡献的痕迹,二人友谊此后中断。详见 [[cantor-stole-infinity|窃取无穷的数学家]]。
## 为何这一结果重要
代数数包含大量"复杂"的数,直觉上似乎比整数"多得多"。但狄德金的证明表明,从集合大小的角度看,代数数和整数一样"少"(都是可数的)。这一反直觉的结果是 [[infinity-hierarchy|无穷层级体系]] 的第一个关键组件,与实数不可数性结合,才完整证明了"存在不同大小的无穷"。
## 相关条目
- [[infinity-hierarchy|无穷层级体系]]
- [[countable-uncountable-infinity|可数与不可数无穷]]
- [[richard-dedekind|里夏德·狄德金]]
- [[georg-cantor|格奥尔格·康托尔]]
- [[cantor-stole-infinity|窃取无穷的数学家]]

View File

@@ -0,0 +1,37 @@
---
title: "算法公平性 (Algorithmic Equity)"
created: 2026-06-10
updated: 2026-06-10
type: concept
tags: ["fairness", "clinical-ai", "health-equity"]
sources: ["[[principled-uncertainty-clinical-ai]]"]
---
# 算法公平性 (Algorithmic Equity)
**算法公平性**关注机器学习系统在不同人口群体中是否产生公正的结果,特别关注系统性地对弱势群体产生不利影响的模式。
## 医疗 AI 中的公平性问题
关键里程碑:
- **Obermeyer et al. (2019, Science)**:广泛部署的商业医疗风险算法系统性将 Black 患者标记为比同等病情的 White 患者更低风险——根因是使用医疗成本作为健康需求的代理指标
- **Seyyed-Kalantari et al. (2021, Nature Medicine)**AI 算法对弱势患者群体的胸部 X 光片诊断不足
- **Celi et al. (2022, PLOS Digital Health)**:全球审查确定三大偏见来源:数据代表性、代理结果、分布偏移
## 不确定性与公平性的连接
[[principled-uncertainty-clinical-ai|Principled Uncertainty in Clinical AI]] 提出范式转换:**校准后的认知不确定性是公平性信号**。
传统公平性审计依赖事后准确率差异——但准确率对系统性偏见不敏感(农村 85.5% vs 三级 82.6%,仅差 2.9pp)。[[uncertainty-equity-gap|UEG]] 在同一场景中检测到 15.3% 的差异。
## 核心机制
训练数据偏向优势群体 → 弱势群体为 OOD → 认知不确定性升高 → UEG 信号
效应量层级(设施 > SES > 年龄 > 性别)精确映射结构性健康不平等的驱动因素。
## 参考
- [[principled-uncertainty-clinical-ai|Principled Uncertainty in Clinical AI]]
- [[uncertainty-equity-gap|UEG]]
- [[clinical-ai|临床 AI]]

View File

@@ -0,0 +1,43 @@
---
title: "AND-OR 交互 (AND-OR Interactions)"
created: 2026-06-03
updated: 2026-06-03
type: concept
tags: [interactions, interpretability, DNN, LLM]
sources:
- "[[zhang-reconciling-sft-interaction-2026]]"
---
# AND-OR 交互 (AND-OR Interactions)
## 定义
AND-OR 交互是 [[interaction-based-explanation|交互基解释]] 框架中用于分解 DNN 推理模式的两种基本交互类型。给定输入变量集合 $N = \{1, 2, ..., n\}$
- **AND 交互** $I_T^{\text{and}}$:当且仅当 $T \subseteq N$ 中**所有**变量同时存在于输入中时激活
- **OR 交互** $I_T^{\text{or}}$:当 $T \subseteq N$ 中**任一**变量存在于输入中时激活
## 在 LLM 中的语义
在 LLM 语境下,每个交互对应一个**短语模式**phrase pattern。例如
- 三个词 "laws"、"of"、"motion" 组成的 AND 交互:仅当三个词同时出现时,为预测 "acceleration" 贡献 +0.41
- 两个词 "force"、"mass" 组成的 OR 交互:任一词出现时即激活
## 数学形式
由 AND-OR 交互构建的 [[logical-model-interaction|逻辑模型]] $\phi(x')$ 为:
$$\phi(x') = \sum_{T \in \Omega^{\text{and}}} I_T^{\text{and}} \cdot \mathbb{1}(\text{AND}_T) + \sum_{T \in \Omega^{\text{or}}} I_T^{\text{or}} \cdot \mathbb{1}(\text{OR}_T) + b$$
其中 $b$ 为偏置标量,$\Omega^{\text{and}}$ 和 $\Omega^{\text{or}}$ 分别为 AND 和 OR 交互的集合。
## 提取方法
通过最小化 LASSO 类损失函数,将网络输出分解为 AND 和 OR 两个分量,分别提取对应的交互效应。详见 Chen et al. (2024) 和 Li & Zhang (2024)。
## 相关概念
- [[interaction-based-explanation|交互基解释]]
- [[logical-model-interaction|交互逻辑模型]]
- [[interaction-order|交互阶数]]
- [[interaction-types-sft|SFT 中的三类交互]]

23
concepts/arxiv.md Normal file
View File

@@ -0,0 +1,23 @@
---
title: "arXiv"
created: 2026-06-03
updated: 2026-06-03
type: concept
tags: [arxiv, preprint, research, publishing]
status: placeholder
---
# arXiv
> ⚠️ 占位符页面 — 待完善
arXiv 是全球最大的学术预印本平台,覆盖物理学、计算机科学、数学、生物学等领域。本 wiki 中大部分论文来自 arXiv。
**arXiv ID 格式**
- 新版:`YYMM.NNNNN`(如 `2605.17967`
- 旧版:`archive/YYMMNNN`(如 `hep-th/0601001`
## 相关概念
- [[knowledge-injection|知识注入]]
- [[kore-knowledge-injection]]

View File

@@ -0,0 +1,48 @@
---
title: "APO 自动提示工程 (Automatic Prompt Optimization)"
created: 2026-06-14
updated: 2026-06-14
type: concept
tags: [prompt-engineering, optimization, llm-deployment, apo]
sources: [raw/articles/qifu-llm-finance-practice-2026.md]
---
# APO 自动提示工程 (Automatic Prompt Optimization)
奇富科技王元总结的**自动提示优化实践经验**。APO 最适合作为高质量 Base Prompt 的基线生成器,在大模型落地初期避免盲目微调。
## 核心经验
### 设计原则
- **System prompt 不宜过长**User prompt 的约束力通常更强
- 利用评测数据集APO 作为 **first draft**,人工少量修改去除过拟合
- 话术和初始提示词结构应经过设计来适应特定任务(如拆分为可优化部分和不变部分)
### 工程实践
- **更小的模型提升幅度会更大** — APO 对小模型性价比更高
- **必须 Batch 处理更新** — 否则容易优化一条样本却劣化很多条样本(蒙特卡洛过程的不稳定性)
- APO 本质是蒙特卡洛过程,**不具备传统梯度下降的稳定性**
- **仅处理错误样本不会获得更好的泛化性**
### Trace 优化
Trace 框架可优化的对象不仅是提示词:
- 函数、提示词、工具描述——涉及文本的都可以交给 Trace 框架
- 充分发挥**全局优化能力**,将流程中的函数和变量信息通过注解引入
- 可以极大提升优化速度和效果
### 验证策略
- 验证集如果采用和训练集一样的数据,可以显著提升训练集分数,但会**失去泛化性**
- 需要使用验证集来**维护帕累托前沿**
## 与 DSPy 的关系
APO 的思想与 DSPy 的自动提示优化高度相似——都是将提示工程从手工调参转变为**程序化优化问题**。奇富科技的实践侧重于工程落地的经验教训。
## 参考
- [[qifu-llm-finance-practice|奇富科技金融 LLM 实践]] — 来源分享
- [[post-hoc-reasoning-rl|后置推理 RL]] — APO 之后的后训练方案

View File

@@ -0,0 +1,51 @@
---
title: "辅助预测目标 (Auxiliary Predictive Objectives)"
created: 2026-06-10
updated: 2026-06-10
type: concept
tags: ["deep-rl", "representation-learning", "self-supervised-learning"]
sources: ["[[predictive-representations-scalable-mtrl]]"]
---
# 辅助预测目标 (Auxiliary Predictive Objectives)
在深度RL中**辅助预测目标**是与主TD目标并行训练的额外损失函数用于提供密集监督信号以改善表征学习。
## 标准预测目标
从潜状态 z_t 和动作 a_t 预测:
1. **下一潜状态** z_{t+1}:动力学预测 → 捕捉因果关系
2. **即时奖励** r_t奖励预测 → 任务相关信号
3. **终止信号** d_t终止预测 → episode 结构
## 梯度流
预测目标的梯度**回传至编码器** phi
```
L_pred = ||phi(s_{t+1}) - f_pred(z_t, a_t)||^2
```
编码器同时接收 TD 损失和预测损失的梯度 → 学习到同时支持值函数近似和动力学预测的表征。
## 在 MR.Q 中的实现
[[mrq-algorithm|MR.Q]] 使用潜空间预测(非像素空间),将预测目标直接作用于编码器输出的 z_t避免高维重建的计算开销。
## 为什么有效
| 信号类型 | 稀疏性 | 平稳性 | 跨任务泛化 |
|---------|-------|--------|----------|
| 奖励信号 | 稀疏 | 非平稳 | 差 |
| 预测目标 | 密集 | 相对平稳 | 好 |
预测目标提供**每个 transition** 的监督(而非仅奖励时刻),且动力学预测是任务无关的 → 天然适合多任务迁移。
## 与 Planning 的本质区别
预测目标学习的模型仅用于**表征塑造**——不做前向 rollout。这避免了模型误差累积和计算开销同时保留了预测监督的表征收益。
## 参考
- [[predictive-representations-scalable-mtrl|Scalable Multitask Deep RL]]
- [[mrq-algorithm|MR.Q]]
- [[predictive-representation-learning|Predictive Representation Learning]]

46
concepts/banach-space.md Normal file
View File

@@ -0,0 +1,46 @@
---
title: "Banach 空间 (Banach Space)"
created: 2026-06-17
updated: 2026-06-17
type: concept
tags: [mathematics, functional-analysis, topology]
sources: [raw/papers/schmocker-weighted-uat-2026.md]
confidence: high
---
# Banach 空间 (Banach Space)
Banach 空间是**完备赋范向量空间**——函数分析中最基础的无限维空间结构。在 [[weighted-uat-manifolds|Schmocker & Teichmann (2026)]] 的 [[functional-input-neural-networks|FNN]] 框架中作为输出空间。
## 定义
`(X, ‖·‖)` 是 Banach 空间,若:
1. 范数 `‖·‖` 完备(所有 Cauchy 序列收敛)
2. `‖x‖ ≥ 0`,等号当且仅当 x=0
3. `‖λx‖ = |λ| ‖x‖``‖x+y‖ ≤ ‖x‖ + ‖y‖`
## 关键性质
- **Hahn-Banach 定理**:线性泛函可延拓
- **开映射定理**:满射连续线性映射是开映射
- **一致有界原理**Banach-Steinhaus
## 在 FNN 中的角色
FNN 的输出空间 Y 是 Banach 空间,允许:
- 线性读出层 `c_k ∈ Y`
- 范数控制的逼近误差界
- BAP有界逼近性质的适用
## 常见例子
- Hilbert 空间(`L^2`)→ Banach 空间的特例
- `L^p` 空间 (p ≠ 2)
- 连续函数空间 `C(K)`
- Sobolev 空间
## 参考
- [[infinite-dimensional-manifolds|无限维流形]]
- [[functional-input-neural-networks|FNN]]
- [[weighted-uat-manifolds|论文原文]]

43
concepts/bare-adapter.md Normal file
View File

@@ -0,0 +1,43 @@
---
title: "Bare Adapter"
created: 2026-06-15
updated: 2026-06-15
type: concept
tags: [benchmark, evaluation, coding-agent]
sources: [raw/papers/zheng-claw-swe-bench-2026.md]
---
# Bare Adapter
## 定义
Bare Adapter 是 Claw-SWE-Bench 中定义的**诊断基线**——提供最小化的 Docker 集成,要求模型直接在最终响应中输出 unified diff。它不是 Full Adapter 的逐组件消融,而是测试"最小接入是否足以创建可靠的 SWE-bench 评测目标"。
## 与 Full Adapter 的对比
| 能力 | Bare Adapter | Full Adapter |
|------|-------------|-------------|
| Docker 进入 | ✅ | ✅ |
| 发送 issue 描述 | ✅ | ✅ |
| 禁用不公平的网络检索 | ✅ | ✅ |
| Workspace 对齐 | ❌ | ✅ |
| Future-Commit 清理 | ❌ | ✅ |
| 共享阶段 Prompt | ❌ | ✅ |
| Git-based Patch 提取 | ❌ | ✅ |
| Patch 清理 | ❌ | ✅ |
| 输出方式 | 模型输出 unified diff | Runner 从仓库状态导出 diff |
## 实验结果
- **Pass@1:** 19.1%GLM 5.1
- **Apply Failed:** 69.1%
- **瓶颈:** 不是模型不能编辑代码,而是直接生成 unified-diff 文本的脆弱性
## 诊断价值
Bare Adapter 证明了 adapter 设计**不是工程包装,而是评分可靠性的必要条件**——最小接入无法使通用 agent 成为 SWE-bench 的可靠评测目标。
## 参考
- [[claw-swe-bench|Claw-SWE-Bench 论文]]
- [[adapter-protocol|适配器协议]]
- [[patch-based-evaluation|Patch-Based Evaluation]]

View File

@@ -0,0 +1,50 @@
---
title: "Bastiani 微积分 (Bastiani Calculus)"
created: 2026-06-17
updated: 2026-06-17
type: concept
tags: [mathematics, differential-calculus, functional-analysis]
sources: [raw/papers/schmocker-weighted-uat-2026.md]
confidence: high
---
# Bastiani 微积分 (Bastiani Calculus)
Bastiani 微积分是**局部凸拓扑向量空间上的一种微分学**——在 [[weighted-uat-manifolds|Schmocker & Teichmann (2026)]] 中用于定义[[infinite-dimensional-manifolds|无限维流形]]上的可微映射。
## 为什么需要
有限维微积分依赖范数的等价性和局部紧性这些在无限维中不成立。Bastiani 微积分使用**方向导数的连续性**作为可微的定义,避免了范数依赖。
## 定义
函数 `f : U → F`U ⊆ E 开E, F 局部凸空间)是 Bastiani C^1 的,若:
1. 对每个方向 v ∈ E方向导数 `Df(x)(v)` 存在
2. 映射 `(x, v) ↦ Df(x)(v)``U × E → F` 上连续
## 高阶推广
k 次连续 Bastiani 可微类 `C^k_B` 定义在**所有多线性映射的连续组合**上。
## 论文中的适配
论文将 Bastiani 微积分适配到**σ-紧设置**
- 标准 Bastiani 在任意开集上工作
- 论文需要在 σ-紧流形上的全局分析
- 引入加权半范数族控制导数的行为
## 与其他微分学的对比
| 微分学 | 适用范围 | 特点 |
|--------|---------|------|
| Fréchet | Banach 空间 | 范数依赖 |
| Gateaux | 一般拓扑向量空间 | 方向导数,不连续 |
| Bastiani | 局部凸空间 | 连续方向导数 |
| Convenient | 任意局部凸空间 | Mackey 连续性 |
## 参考
- [[infinite-dimensional-manifolds|无限维流形]]
- [[weighted-spaces|加权空间]]
- [[weighted-uat-manifolds|论文原文]]

View File

@@ -0,0 +1,39 @@
---
title: "贝叶斯深度学习 (Bayesian Deep Learning)"
created: 2026-06-10
updated: 2026-06-10
type: concept
tags: ["uncertainty-quantification", "variational-inference"]
sources: ["[[principled-uncertainty-clinical-ai]]"]
---
# 贝叶斯深度学习 (Bayesian Deep Learning)
**贝叶斯深度学习**将贝叶斯推断框架应用于深度神经网络,为权重和预测赋予概率分布而非点估计,从而自然地实现 [[uncertainty-quantification|不确定性量化]]。
## 核心思想
传统深度学习:学习确定性的权重 w -> 输出点估计 y_hat = f_w(x)
贝叶斯深度学习:学习权重的后验分布 p(w|D) -> 输出预测分布 p(y|x, D)
## 变分推断方法
由于精确后验不可计算,使用变分推断近似:
1. **[[variational-autoencoder|变分自编码器]]**Kingma & Welling, 2014通过重参数化技巧优化 ELBO
2. **[[mc-dropout|MC Dropout]]**Gal & Ghahramani, 2016训练时 Dropout ≈ 深度高斯过程中的贝叶斯推断
3. **Bayes by Backprop**Blundell et al., 2015直接在权重上学习分布
## 临床 AI 应用
[[principled-uncertainty-clinical-ai|Principled Uncertainty in Clinical AI]] 展示了完整的端到端贝叶斯管线:
- 模态特定变分编码器 → 潜空间分布
- [[precision-weighted-fusion|精度加权融合]] → 融合后验
- 分解不确定性头 → [[epistemic-uncertainty|认知]] + [[aleatoric-uncertainty|随机]]
## 参考
- [[principled-uncertainty-clinical-ai|Principled Uncertainty in Clinical AI]]
- [[variational-autoencoder|VAE]]
- [[mc-dropout|MC Dropout]]

View File

@@ -0,0 +1,52 @@
---
title: "贝叶斯非参数 TPP (Bayesian Nonparametric TPP)"
created: 2026-06-16
updated: 2026-06-16
type: concept
tags: [temporal-point-process, bayesian, nonparametric, gaussian-process]
sources: [raw/papers/advances-temporal-point-processes-2026.md]
---
# 贝叶斯非参数 TPP
贝叶斯非参数 TPP 用灵活的先验过程(如高斯过程)替代固定的参数化强度函数,在保持贝叶斯推理严谨性的同时大幅提升模型灵活性。
## 核心思想
传统参数 TPP 需手工指定强度函数形式(如指数衰减触发核),贝叶斯非参数方法则:
```
lambda(t) ~ GP(mu(·), K(·,·))
```
用一个高斯过程先验赋予强度函数以无限维的灵活度,数据自动调节复杂度。
## 两大方向
### 非参数泊松过程
用 GP 对强度函数 `lambda(t)` 建模:
- **Log-Gaussian Cox Process (LGCP)**`lambda(t) = exp(f(t))`, `f ~ GP`
- 代表性工作Møller et al. (1998), Adams et al. (2009), Lloyd et al. (2015)
- 挑战Poisson 似然非共轭,需变分推断或 MCMC 近似后验
- 关键突破:变分 Fourier 特征 (John & Hensman, 2018) 实现可扩展训练
### 非参数 Hawkes 过程
对触发函数 `phi(·)` 采用非参数先验:
- 用 GP 或样条对触发核的灵活形式进行贝叶斯推断
- 代表性工作Zhang et al. (2019, 2020b), Zhou et al. (2021, 2020)
- 可同时推断触发核的形状和因果结构
## 为什么重要
相比频率学派非参数方法,贝叶斯方法提供:
1. **不确定性量化**:强度函数的可信区间
2. **自动正则化**:先验防止过拟合
3. **模型选择**:边际似然可用于比较不同模型
## 参考
- [[temporal-point-process|时间点过程]]
- [[hawkes-process|Hawkes 过程]]
- [[advances-temporal-point-processes-2026|TPP 综述]]

View File

@@ -0,0 +1,44 @@
---
title: "Bellman-Taylor 得分解码 (BTSD)"
created: 2026-06-17
updated: 2026-06-17
type: concept
tags: [reinforcement-learning, mdp, action-interface, operations-research]
sources: [raw/papers/chen-bellman-taylor-score-2026.md]
confidence: high
---
# Bellman-Taylor 得分解码 (BTSD)
BTSD 是 [[bellman-taylor-score-decoding|Chen et al. (2026)]] 提出的框架,通过**Taylor 展开最优 Q 函数**将 MDP 的动作空间从复杂约束空间转换为无约束欧氏得分空间。
## 核心机制
```
原始 MDP (s, a ∈ A(s) 受约束) → Taylor 展开 Q* → 得分 MDP (s, z ∈ R^d)
```
1. **Taylor 近似**`Q*(s,a) ≈ ψ_s(a) + γ⟨∇G*_s, φ_s(a)⟩ + const`
2. **动作解码器**`Γ(s,z) = argmax [ψ_s(a) + ⟨z, φ_s(a)⟩]`
3. **策略学习**:π̃ 输出得分 z ∈ R^d无约束连续动作
4. **前向解码**:解码器 Γ(s,z) 将 z 映射为可行动作 a
## 与优化层的区别
| 方法 | 解码器角色 | 梯度需求 |
|------|----------|---------|
| Differentiable Optimization | 可训练层 | 需通过优化器反向传播 |
| BTSD | 固定 action-selection map | 仅前向传播,无需梯度 |
## 性能保证
最优性差距 `J* J_decode ≤ ε_approx + ε_learn`
- `ε_approx` 由 Taylor 余项控制
- `ε_learn` 是标准 DRL 的泛化误差
## 参考
- [[latent-score-mdp|潜在得分 MDP]]
- [[action-decoder|动作解码器]]
- [[taylor-expansion-q-function|Q 函数 Taylor 展开]]
- [[bellman-taylor-score-decoding|BTSD 论文]]

View File

@@ -0,0 +1,62 @@
---
title: "Block-Sparse Attention Mask (分块稀疏注意力掩码)"
created: 2025-06-02
updated: 2025-06-02
type: concept
tags: [attention, training-optimization, multi-turn-reasoning]
sources: ["[[goru-one-pass-to-reason-2025]]"]
---
# Block-Sparse Attention Mask
> [[goru-one-pass-to-reason-2025|One-Pass to Reason]] 中设计的自定义注意力掩码,通过为不同 token 类型指定不同的可见性规则,在单次前向传播中同时满足"生成时可见、上下文时隐藏"的冲突需求。
## 可见性规则
在多轮推理对话中token 被分为四种角色:
| Token 类型 | 角色 | 可见范围 |
|-----------|------|---------|
| hi | 人类消息 | A(H_{<i}) 只看历史 |
| ti | 推理 token | A(H_{<i}, hi) 看历史+当前人类消息 |
| ri_in | 上下文副本 | A(H_{<i}, hi) 不看推理 token |
| ri_out | 生成副本 | A(H_{<i}, hi, ti) 看全部 |
## 结构特点
1. **分块稀疏**整个掩码按对话轮次和 token 类型划分为 block每个 block 有不同的稀疏模式
2. **因果性保持**所有 token 仍遵循因果约束不偷看未来
3. **选择性可见**核心创新——ri_in ri_out 虽然内容相同但对 ti 的可见性不同
## 与标准掩码的区别
- **标准因果掩码**所有 token 看到所有之前的 token
- **Block-Sparse Mask**特定 token 类型跳过特定块ri_in 跳过 ti
## 高效生成
因为掩码需要在 GPU 上为每个 batch 动态生成论文提出了向量化生成算法
```python
# 伪代码
M[i][j] = can_see(role[i], role[j]) AND causal(i, j)
# role 映射: 0=pad, 1=human, 2=thinking, 3=response_in, 4=response_out
```
用卡诺图Karnaugh map化简布尔逻辑最小化逻辑运算次数
## 实现后端
使用 [[flex-attention|PyTorch FlexAttention]]Dong et al., 2024因为 FlashAttention-2 不支持传入自定义掩码
## 与 packing 的兼容
可与 [[sequence-packing]] 叠加打包掩码防跨样本污染与自定义注意力掩码通过逻辑 AND 结合
## 相关
- [[one-pass-fine-tuning]]
- [[token-duplication]]
- [[visibility-constraint]]
- [[flex-attention]]
- [[goru-one-pass-to-reason-2025|One-Pass to Reason 论文]]

View File

@@ -0,0 +1,32 @@
---
title: "Boundary Compliance"
created: 2026-06-05
updated: 2026-06-05
type: concept
tags: [agent-safety, harness, policy, access-control]
sources: [[liu-auditing-agent-harness-safety]]
---
# Boundary Compliance (L1)
**边界合规**是 [[agent-harness-safety|Agent 骨架安全]]三层审计框架的第一层L1评估执行轨迹中的每个 action 是否保持在 [[execution-harness|骨架]] 所指定的权限策略(Π)和信息流策略(Φ)边界内。
## 三个审计通道
| 通道 | 违规类型 | 示例 |
|------|---------|------|
| **工具违规** (Tool) | 调用未经授权的、任务无关的、或角色超出的工具 | 数据分析师调用 sudo 命令 |
| **资源违规** (Resource) | 访问受保护的或超出范围的资源 | 查询其他用户的医疗记录 |
| **信息流违规** (Info-Flow) | 向未经授权的接收方泄露信息 | 将客户数据转发给非授权 Agent |
## 与 L2/L3 的关系
- L1 是**安全门控**:即使 L2 执行忠实度高、任务完成好,如果边界被突破,整体评分受乘法惩罚(参见 [[safety-adherence-rate|SAR]]
- L3 [[system-stability]] 评估 L1 在扰动下是否保持——即"合规是否鲁棒"
- L2 [[execution-fidelity]] 评估行动是否有效,但 L1 评估行动是否允许——二者正交
## 核心发现
HarnessAudit 实验表明Liu et al., 2026**资源访问是 L1 中最薄弱的环节**。Agent 通常不会调用明显不合适的工具,而是会选择看似合理的工具但将其应用于错误、无关或未经授权的资源。这意味着工具层面的粗略约束是有效的,但**资源粒度的精确控制**仍是开放挑战。
在 [[multi-agent-safety|多 Agent 场景]]中L1 的信息流违规主要表现为**敏感信息泄露**——Agent 能够正确识别通信对象,但无法控制共享的内容。这指向 [[information-flow-control|信息流控制]] 在骨架设计中的核心地位。

49
concepts/bounded-reuse.md Normal file
View File

@@ -0,0 +1,49 @@
---
title: "有界复用 (Bounded Reuse)"
created: 2026-06-14
updated: 2026-06-14
type: concept
tags: [agent, experience-reuse, composition, limitation]
sources: [raw/papers/procedural-skills-to-strategy-genes-2026.md]
---
# 有界复用 (Bounded Reuse)
Wang et al. (2026) 中发现的经验复用基本原则:**复用有范围边界,不能以无约束的"技能袋"方式运作**。
## 核心证据
### 多 Gene 组合的反直觉结果
| 条件 | Avg. | Δ |
|------|------|-----|
| 单一靶向 Gene | 54.0% | +3.0 |
| 两个冲突 Gene | 53.2% | +2.2 |
| 两个互补 Gene | 44.9% | -6.1 |
| 三个互补 Gene | 50.4% | -0.6 |
关键发现:**互补组合比冲突组合更有害**。主要失败模式不是矛盾,而是多个部分相关的控制对象竞争注意力,共同模糊预期控制信号。
## 解释
在专业科学任务(如谱学分析、蛋白质解析、气候归因)中,成功的问题解决需要**相对精确且领域特定的控制**。添加多个 Gene——即使名义上是互补的——可能
1. 模糊控制焦点
2. 引入竞争性约束
3. 削弱专业特异性
## 与"越多越好"的张力
有界复用直接挑战了**经验积累文献中的隐含假设**更多的结构化经验自然更有益。Wang et al. 表明,有效复用的关键在于**选择性**:选择足够靶向的控制对象,而非在同一推理上下文中积累多个相关对象。
## 实践启示
- 在专家级科学任务中,**单一靶向 Gene 可靠优于多 Gene 组合**
- 组合需要比"都是相关的"更强的理由——需要明确**非重叠的、可分离的控制维度**
- 经验复用系统应该包含**排序/选择机制**,而非朴素地注入所有可检索的经验
## 参考
- [[procedural-skills-to-strategy-genes|Skills to Strategy Genes]] — 发现来源
- [[gene-probe|基因探针]] — 包含组合实验
- [[strategy-gene|策略基因]] — 复用单元
- [[experience-distillation|经验蒸馏]] — 选择性而非加性积累

50
concepts/btsd-ppo.md Normal file
View File

@@ -0,0 +1,50 @@
---
title: "BTSD-PPO"
created: 2026-06-17
updated: 2026-06-17
type: concept
tags: [reinforcement-learning, algorithm, ppo, action-interface]
sources: [raw/papers/chen-bellman-taylor-score-2026.md]
confidence: high
---
# BTSD-PPO
BTSD-PPO 是 [[bellman-taylor-score-decoding|Bellman-Taylor Score Decoding]] 框架与 PPO 的**具体算法实例**——在潜在得分 MDP 上使用标准 PPO 训练,无需对动作解码器求导。
## 算法流程
```
每轮:
1. 观察状态 s_t
2. 策略 π̃ 输出得分 z_t ~ π̃(·|s_t)
3. 解码器: a_t = Γ(s_t, z_t) # 前向传播,无梯度
4. 环境执行 a_t返回 r_t, s_{t+1}
5. 收集 (s_t, z_t, r_t) 到轨迹 buffer
6. PPO 更新: θ ← θ + η ∇_θ L_PPO(θ)
# 梯度仅涉及 log π̃_θ(z|s),不涉及 Γ
```
## 关键特性
- **零梯度解耦**解码器是完全的黑箱优化器PPO 策略梯度对其透明
- **标准化接口**:π̃ 输出连续向量 zπ̃ 是标准高斯策略
- **无需架构改动**:直接使用现成的 PPO 实现
## 与可微优化层的区别
可微优化层方法需要 `∂a/∂z = ∂Γ(s,z)/∂z` 用于反向传播——这对组合/整数优化问题是不可微的。BTSD-PPO 用 `∇_θ log π̃_θ(z|s)` 替代,完全绕过此问题。
## 其他 DRL 算法兼容性
BTSD 框架不限于 PPO——任何连续动作 DRL 算法均可应用:
- SAC, TD3 等 actor-critic 方法
- 离散化得分空间后也可用 DQN
- 实验表明性能提升来自 BTSD 框架本身,而非特定优化器
## 参考
- [[bellman-taylor-score-decoding|BTSD]]
- [[latent-score-mdp|潜在得分 MDP]]
- [[action-decoder|动作解码器]]

View File

@@ -0,0 +1,22 @@
---
title: "灾难性遗忘 (Catastrophic Forgetting)"
created: 2026-06-03
updated: 2026-06-03
type: concept
tags: [forgetting, continual-learning, LLM, fine-tuning]
status: placeholder
---
# 灾难性遗忘 (Catastrophic Forgetting)
> ⚠️ 占位符页面 — 待完善
灾难性遗忘指神经网络在新任务上训练后,在先前已掌握的任务上性能急剧下降的现象。在 LLM 的持续指令微调中尤为突出。
[[zhang-reconciling-sft-interaction-2026|Zhang et al. (2026)]] 的交互视角为此提供了新解释SFT 后阶段的过拟合交互可能覆盖或干扰了已有的可靠推理骨架([[preserved-interactions-backbone|保留交互]])。
## 相关概念
- [[supervised-fine-tuning|SFT]]
- [[preserved-interactions-backbone|保留交互作为推理支柱]]
- [[sft-denoising-stage|SFT 去噪阶段]]

View File

@@ -0,0 +1,43 @@
---
title: "因果分解 (Causal Decomposition in POMG)"
created: 2026-06-10
updated: 2026-06-10
type: concept
tags: ["pomg", "structural-causal-model", "decomposition"]
sources: ["[[minimax-policy-regret-pomg]]"]
---
# 因果分解 (Causal Decomposition in POMG)
**因果分解**是 [[minimax-policy-regret-pomg|Arora (2026)]] 中 POMG 分析的核心结构洞察:将 [[observable-operator-model|OOM]] 算子分解为两个独立组件,使世界估计和对手控制可以分离处理。
## 分解公式
对于 POMG 的 OOM 算子 J_h(o, a)
```
J_h(o, a) = W_h(o, a) · G_h(pi)
```
- **W_h(o, a)**(世界通道):仅依赖世界参数 theta
- 包含转移核 T_h(s, a, b -> s') 和发射核 E_h^A(s -> o)
- 对手的私有观测和动作已被边缘化
- **G_h(pi)**(对手聚合):仅依赖对手参数 Phi
- 编码对手策略如何响应学习者策略 pi
- 在线性对手下为矩阵乘法
## 为什么重要
1. **模块化分析**:世界估计误差和对手建模误差可以独立 bound
2. **维度可加性**:总 [[eluder-dimension|Eluder 维度]] d_E = d_Theta + d_Psi
3. **算法设计**MLE 仅需估计 Theta对手 Lipschitz 性质仅需控制 Phi
## 直观理解
这类似于因果推断中的"解耦"思想——将总体观测动力学分解为"自然界如何运作"(世界通道)和"对手如何反应"(对手聚合)两个因果独立的部分。
## 参考
- [[minimax-policy-regret-pomg|Minimax-Optimal Policy Regret in POMGs]]
- [[observable-operator-model|OOM]]
- [[eluder-dimension|Eluder Dimension]]

View File

@@ -0,0 +1,53 @@
---
title: "Causal Information Flow"
created: 2026-06-05
updated: 2026-06-05
type: concept
tags: [causal-attention, information-flow, sparse, transformer]
sources: [[niu-stem-causal-sparse-attention]]
---
# Causal Information Flow
**因果信息流**Causal Information Flow是 [[stem-sparse-attention|Stem]] 论文提出的分析因果注意力机制的**理论视角**。它揭示了标准稀疏注意力方法系统性忽略的递归依赖结构。
## 理论基础
在因果 Transformer 第 l 层,对 query 位置 i输出是前序 Value 向量的加权和:
```
O_i^(l) = Σ_{j=1}^{i} P_{i,j}^(l) · V_j^(l)
```
这揭示了**根本性的 token 不对称性**
| Token 位置 | 参与度 | 稀疏化影响 |
|-----------|--------|-----------|
| V₁ (第1个) | 参与所有 N 个输出的计算 | **全局失真** —— 剪枝影响每个后续 token |
| V_N (最后) | 仅参与最终输出 O_N | **局部误差** —— 仅影响尾部 |
## 跨层递归放大
这种不对称性在深层网络中**递归放大**。第 l+1 层的 V 向量来自第 l 层的输出经复合映射 TFFN + 残差 + W_V
```
V^(l+1) = T(O^(l))
```
这意味着:
- 在第 l 层剪枝 V₁ → 第 l 层的所有输出畸变 → 第 l+1 层的**所有** V 向量畸变 → 整个信号流被污染
- 这种误差传播是**递归的**:早期小小的扰动在深层被指数级放大
## 与均匀稀疏化的冲突
现有的 [[sparse-attention-patterns|稀疏注意力方法]] 对一层内所有位置应用相同的 top-k——这完全无视了因果信息流的结构
- 初始 token和尾部 token被同等对待
- 茎 token 的剪枝造成全局信号破坏,而节省的算力有限
## 设计启示
因果信息流视角指导了 [[token-position-decay|TPD 策略]]的设计:
- 茎 token → 高保留率(保护递归依赖链)
- 叶 token → 激进稀疏化(这些 token 的剪枝影响局部)
这不是启发式的——是从因果注意力机制的数学结构中推导出的结构约束。

View File

@@ -31,8 +31,13 @@ Chain-of-Thought (CoT) 是让模型在给出最终答案前,先生成一系列
通过直接输出归一化坐标,视觉原语使 CoT 的每一步推理都有对应的、可验证的空间锚点。
## 推荐系统中的 CoT
[[recommendation-cot|推荐 CoT]] 将思维链范式引入 [[generative-recommendation|生成式推荐]] 领域面临独特的挑战item token 本身不携带语言语义,且推荐是 [[abductive-reasoning-recommendation|溯因推理]](从行为反推隐含兴趣)而非演绎推理。[[onereason|OneReason]] 提出三层 CoT 结构Derivation → Evolution → Recommendation来解决这一问题。
## 相关概念
- [[visual-primitives|视觉原语]] — CoT 的视觉扩展
- [[reference-gap|引用鸿沟]] — 纯语言 CoT 的根本局限
- [[system-2-thinking|System-2 思维]] — CoT 的理论基础
- [[recommendation-cot|推荐 CoT]] — CoT 在推荐系统中的特化

View File

@@ -0,0 +1,54 @@
---
title: "Claw-SWE-Bench Lite"
created: 2026-06-15
updated: 2026-06-15
type: concept
tags: [benchmark, evaluation, coding-agent]
sources: [raw/papers/zheng-claw-swe-bench-2026.md]
---
# Claw-SWE-Bench Lite
## 定义
Claw-SWE-Bench Lite 是完整 350-instance benchmark 的 **80-instance 低代价子集**设计为开发迭代的快速反馈环——adapter 调试、prompt 修改、模型替换、回归测试——在返回 full-350 进行最终报告之前。
## 设计原则
Lite 不是简单的随机采样或便利展示样本。它是**通过代价感知、排序感知的优化过程,拟合 full-350 的行为**选取的。
## 构成
- 每语言 10 个实例 × 8 语言 = 80 个实例
- 70 个非 Python来自 SWE-bench-Multilingual+ 10 个 Python来自 SWE-bench-Verified-Mini
- 语言内固定难度四分位配额Q1/Q2/Q3/Q4 = 2/3/3/2
- 覆盖 full-350 43 个仓库中的 34 个79%
## 选择方法
基于 17 列校准数据9 个 OpenClaw 模型列 + 8 个跨 claw 列),优化三项指标:
1. **Resolve-Rate Parity:** 最小化 Lite 估计率与 full-350 真实率之间的 L1 差异
2. **Pairwise Ranking Hinge:** 惩罚 Lite 反转 full-350 的排序
3. **Cost Parity:** 最小化 log-cost 差异,防止选取异常便宜或昂贵的实例
使用 per-language 200-restart within-quartile 1-swap 局部搜索。
## 验证结果
- Full-350 平均 Pass@1: 0.639 / Lite-80: 0.643(差异 +0.4 pp
- 跨 claw 验证 (5 claws × 2 models):平均绝对差异 1.88 pp最大 3.68 pp
- Lite 运行代价约为 full 的 **22.9%**(按 token/cost/time 均在 22-24%
## K-sweep 敏感性
Lite 的 80-instance 规模来自显式的 K-sweep 而非方便数字:
- K=8: 2 个场景通过
- K=9: 3 个场景需要
- K=10: 4 个结构扰动场景需要
- 发布保守稳定点 K=10
## 参考
- [[claw-swe-bench|Claw-SWE-Bench 论文]]
- [[cost-aware-benchmarking|代价感知基准评测]]
- [[pareto-frontier-evaluation|Pareto 前沿评测]]

View File

@@ -0,0 +1,40 @@
---
title: "清洁条件掩码 (Clean-Conditioning Mask)"
created: 2026-06-13
updated: 2026-06-13
type: concept
tags: [computer-vision, video-generation, diffusion-model, architecture]
sources: [raw/papers/cheng-flex4dhuman-2026.md]
---
# 清洁条件掩码 (Clean-Conditioning Mask)
Flex4DHuman 中用于区分参考视图 token 与目标视图 token 的二元掩码机制,是模型理解"哪些是已知、哪些需要生成"的核心设计。
## 输入布局
每个 token 采用 36 通道特征布局:
| 通道 | 尺寸 | 参考视图 | 目标视图 |
|------|------|---------|---------|
| Noisy latent | 16 ch | 噪声 latent | 噪声 latent |
| Clean latent | 16 ch | 编码的参考 latent | **全零** |
| 条件掩码 | 4 ch | **全一** | **全零** |
## 工作原理
- **训练时**:参考视图 token 的清洁潜在和掩码使它们成为"已知条件"——模型学习在去噪目标视图 token 时利用这些条件,同时保留参考视图不变
- **推理时**:相同的机制被复用于 [[temporal-rollout|时间滚动展开]]——前一个 chunk 的预测帧作为下一个 chunk 的「清洁历史 token」
- **信息流**:单次注意力操作中,信息在时间和视角维度上双向传播
## 从 Wan 2.1 的适配
原始 Wan 2.1 T2V 期望 16 通道输入。Flex4DHuman 通过以下方式扩展到 36 通道:
- 复制预训练权重到原始 16 通道位置
- 新增 20 通道参数用零初始化
## 参考
- [[flex4dhuman|Flex4DHuman]] — 提出该设计的模型
- [[temporal-rollout|时间滚动展开]] — 推理时重用清洁历史
- [[teacher-forced-history|教师强制历史]] — 训练时的清洁历史策略

42
concepts/clinical-ai.md Normal file
View File

@@ -0,0 +1,42 @@
---
title: "临床人工智能 (Clinical AI)"
created: 2026-06-10
updated: 2026-06-10
type: concept
tags: ["healthcare", "machine-learning", "medical-ai"]
sources: ["[[principled-uncertainty-clinical-ai]]"]
---
# 临床人工智能 (Clinical AI)
**临床人工智能**是将机器学习系统部署于医疗环境中的交叉领域,涵盖诊断影像、风险分层、治疗规划和患者分诊等应用。
## 核心挑战
1. **确定性输出的局限**:绝大多数临床 AI 系统输出点估计(如"73% 风险概率"),不提供置信度,无法区分高置信场景与分布外输入
2. **校准问题**:现代深度神经网络普遍校准不良(见 [[expected-calibration-error|ECE]]
3. **公平性盲点**:标准准确率指标无法检测系统性偏见
## 不确定性在临床 AI 中的双重角色
[[principled-uncertainty-clinical-ai|Principled Uncertainty in Clinical AI]] 提出:
| 传统观点 | 新观点 |
|---------|-------|
| 不确定性 = 模型局限 | 不确定性 = **公平性资源** |
| 目标:最小化不确定性 | 目标:度量、报告、根据不确定性采取行动 |
高 [[epistemic-uncertainty|认知不确定性]] → 模型"知道自己不知道" → 触发人工升级 → 系统性保护弱势患者
## 关键技术栈
- [[bayesian-deep-learning|贝叶斯深度学习]] — 概率建模
- [[uncertainty-quantification|不确定性量化]] — UQ 方法
- [[precision-weighted-fusion|多模态融合]] — 处理异构临床数据
- [[algorithmic-equity|算法公平性]] — 公平性审计
## 参考
- [[principled-uncertainty-clinical-ai|Principled Uncertainty in Clinical AI]]
- [[algorithmic-equity|算法公平性]]
- [[uncertainty-quantification|不确定性量化]]

42
concepts/coconut.md Normal file
View File

@@ -0,0 +1,42 @@
---
title: "COCONUT: 连续潜空间推理"
created: 2026-06-17
updated: 2026-06-17
type: concept
tags: [reasoning, latent-reasoning, architecture, training]
sources: [raw/papers/zhang-tarpo-2026.md]
confidence: high
---
# COCONUT: 连续潜空间推理
COCONUTHao et al., 2024是**将 LLM 推理过程转移到连续潜空间的先驱工作**。
## 核心思想
传统的 [[chain-of-thought|思维链]] 在每一步都必须生成离散 token但 Transformer 内部维护着高维隐藏状态——COCONUT 认为这种"隐藏 → token"的坍缩造成了信息损失。
## 方法
1. **直接馈入隐藏状态**:将 Transformer 最后一层的隐藏状态作为"thought token"直接输入到后续步骤
2. **并行路径探索**:连续空间允许在推理过程中保留多条可能路径的信息
3. **训练方式**:通过专门的训练目标使模型学会在潜空间中进行推理
## 与 TARPO 的关系
COCONUT 是**纯潜在推理**的代表,所有推理步骤都在连续空间中进行:
- COCONUT 证明了潜空间推理的可行性
- 但其天然确定性限制了 RL 中的策略探索
- [[tarpo|TARPO]] 在 COCONUT 的基础上引入自适应混合路由,在需要随机性时使用离散 token在需要表达力时使用潜空间
## 限制
- 原始隐藏状态可能导致**表征流形不匹配**(与 token embedding 空间不一致)
- 缺乏 NLP 任务中自然出现的离散 token 级别的随机性
- 后续工作(如 [[hrpo|HRPO]])改用 embedding 混合而非原始隐藏状态
## 参考
- [[latent-reasoning|潜在推理]]
- [[tarpo|TARPO]]
- [[continuous-representation|连续表征]]

View File

@@ -0,0 +1,55 @@
---
title: "概念格 (Concept Lattice)"
created: 2026-06-17
updated: 2026-06-17
type: concept
tags: [mathematics, lattice-theory, interpretability, formal-concept-analysis]
sources: [raw/papers/zhang-geometric-sae-2026.md]
confidence: high
---
# 概念格 (Concept Lattice)
概念格是 [[formal-concept-analysis|形式概念分析FCA]] 的核心结构——所有形式概念按集合包含关系组织的**完备格complete lattice**。
## 结构
给定形式上下文 (C, N, R)
- 每个节点 = 一个形式概念 `(A, B)`,满足 `A' = B``B' = A`
- A ⊆ C 是外延extent该概念覆盖的人类概念
- B ⊆ N 是意图intent该概念涉及的 SAE 神经元
## 层级
```
从顶到底:
最一般概念 ← → 最具体概念
(大外延/小意图) (小外延/大意图)
Top: (C, ∅) → 所有概念的并集
Bottom: (∅, N) → 所有神经元的交集
```
[[geometric-sae-concepts|Zhang et al. (2026)]] 图 2 展示了一个实例Math → Algebra / TopologyAnimal → Predator / Plant形成从抽象到具体的完整层级。
## 在 SAE 解释中的作用
概念格提供了**系统化组织多对多神经元-概念关系**的方式:
- 沿格向上 = 概念合并merge、神经元意图粗化
- 沿格向下 = 概念分裂split、神经元意图细化
- 避免了"选择最佳单一匹配"的信息损失
## 概念学习 ≠ 解释的数学表征
格结构揭示:
- 概念学习C → N和神经元解释N → C是格中的**对偶运算**
- 两者通过 Galois 连接关联,但**不必一致**
- 格的层级体现了 AI 学到的语义本体论
## 参考
- [[formal-concept-analysis|FCA]]
- [[polysemanticity|多义性]]
- [[geometric-sae-concepts|几何框架论文]]

View File

@@ -0,0 +1,67 @@
---
title: "概念学习:几何视角 (Concept Learning: Geometric View)"
created: 2026-06-17
updated: 2026-06-17
type: concept
tags: [interpretability, geometry, theory, set-theory]
sources: [raw/papers/zhang-geometric-sae-2026.md]
confidence: high
---
# 概念学习:几何视角 (Concept Learning: Geometric View)
[[geometric-sae-concepts|Zhang et al. (2026)]] 将概念学习形式化为**集合对齐问题**,并区分三个强度递增的学习层次。
## 基本设定
- 人类概念 `C ∈ C`:可测集合(数据点)
- 模型概念 `θ_M`:神经元集合 M 的联合激活区域
- 目标:使 θ 与 C 对齐
## 三个层次
### 1. 概念检测Concept Detection— 最弱
```
µ(C \ θ) = 0
```
θ 覆盖 C 即可。允许多对多映射,一个概念可被多个 θ 覆盖,一个 θ 可覆盖多个概念。
### 2. 概念分离Concept Separation— 中等
```
x ∈ H_i^+ ∀ x ∈ C, i ∈ M
x' ∈ H_j^- ∀ x' ∈ X\C, j ∈ [d]\M
```
θ 在**数据支持**上独占 C。关键定理
- **单神经元**:可行 ↔ `Conv(C) ∩ Conv(N) = ∅`
- **多神经元单元**:可行 ↔ `Conv(C) ∩ N = ∅`
- 最少需要 |C| 个神经元来分离所有概念
### 3. 概念近似Concept Approximation— 最强
概念分离的"环境空间版本"——θ 必须在全部 `R^d` 空间上紧致包围 C
- 可行 ↔ C 是凸集up to ν-null set
- 非凸概念有不可约误差 `e_irr = ν(Conv(C)\C)`
- 误差率:`e_app ≲ e_irr + A|M|^{-2/(r-1)}`
- 支持**新概念发现**(可拒绝未知数据)
## 核心洞察
三个层次对应三种使用场景:
| 层次 | 应用 | 关键需求 |
|------|------|---------|
| 检测 | 覆盖已知概念 | 最少神经元 |
| 分离 | 分类/区分概念 | 数据支持上零假阳 |
| 近似 | 新概念发现 | 环境空间上紧致包围 |
## 参考
- [[sparse-autoencoder|SAE]]
- [[formal-concept-analysis|FCA]]
- [[geometric-sae-concepts|几何框架论文]]

View File

@@ -0,0 +1,58 @@
---
title: "条件强度函数 (Conditional Intensity Function)"
created: 2026-06-16
updated: 2026-06-16
type: concept
tags: [temporal-point-process, intensity-function, stochastic-modeling]
sources: [raw/papers/advances-temporal-point-processes-2026.md]
---
# 条件强度函数 (Conditional Intensity Function)
条件强度函数是时间点过程TPP的核心数学工具描述了给定历史信息下未来事件发生的瞬时速率。
## 定义
```
lambda*(t) dt = P(event in [t, t+dt] | H_{t-})
= E[N([t, t+dt]) | H_{t-}]
```
其中 `H_{t-}` 表示到时刻 t 之前(不含 t的历史。`*` 号表示该强度以历史为条件,这是 TPP 领域的传统标记。
## 与条件密度的一一对应
强度函数和条件密度函数是一一对应的:
```
f(t | H_{t_n}) = lambda*(t) exp(-∫_{t_n}^t lambda*(tau) dtau)
```
这意味着可以通过直接指定强度函数的形式来定义新的 TPP 模型。
## 经典实例
- **常数强度** `lambda*(t) = mu` → 齐次泊松过程
- **时变强度** `lambda*(t) = lambda(t)` → 非齐次泊松过程
- **Hawkes 形式** `lambda*(t) = mu + sum phi(t - t_n)` → 自激励过程
## 在神经 TPP 中的角色
几乎所有神经 TPP 都围绕如何从历史中学习然后参数化强度函数展开。RNN/Transformer 编码历史为隐向量 `h_t`,然后输出为强度:
```
lambda*(t) = g(h_t, t)
```
其中 `g` 需要保证非负输出ReLU/softplus/exp
## 数值积分问题
MLE 训练时需要计算 `∫ lambda*(tau) dtau`,这通常没有闭式解,需要 Monte Carlo 或数值积分近似——这是 intensity-based 方法的计算瓶颈,驱动了 [[intensity-free-modeling|intensity-free]] 方向的发展。
## 参考
- [[temporal-point-process|时间点过程]]
- [[hawkes-process|Hawkes 过程]]
- [[intensity-free-modeling|Intensity-free 建模]]
- [[advances-temporal-point-processes-2026|TPP 综述]]

View File

@@ -0,0 +1,44 @@
---
title: "Content-Grounded Retrieval — Faithfulness as First Principle"
type: concept
created: 2026-06-04
tags: [information-retrieval, faithfulness, hallucination-mitigation, grounding]
sources: ["ma-intragent-2026"]
---
# Content-Grounded Retrieval内容锚定检索
**定义**:一种信息检索范式,要求所有回答严格锚定于提供的文献内容,当信息不存在时明确承认而非编造。
## 核心原则
1. **忠实性优先**:准确性建立在内容忠实之上——错误的精确数字比诚实的"不知道"更有害
2. **显式边界**:当问题超出文献覆盖范围时,系统必须明确终止而非猜测
3. **可溯源**:每个提取的信息点应能追溯到原文献的具体位置
## 在 IntraView 中的体现
[[intraview|IntraView]] 任务将内容锚定作为硬约束,与现有任务的差异:
| 任务 | 信息源 | 内容锚定? |
|------|--------|-----------|
| 开放域 QA | 外部知识 | 否(可引入 LLM 知识) |
| RAG QA | 检索片段+模型知识 | 部分LLM 仍可补充) |
| **IntraView** | **仅提供文献** | **是(严格硬约束)** |
## 实现机制
[[intragent|IntrAgent]] 通过组合设计实现内容锚定:
- [[sufficiency-check|充分性检查]]:确保信息确实来自文献而非推测
- 细节锚定:每个细节关联到原文献的具体句子
- 缺失处理:通过"以上皆非"选项处理不可回答的查询
## 更广的意义
内容锚定检索不仅是 IntraView 的需求——它是可信 AI 系统的底层要求。在医疗、法律、科研决策场景中,"我不知道但文献说 X" 远比 "我认为是 Y" 更有价值。
## 相关概念
- [[hallucination-mitigation]] — 更广泛的幻觉控制
- [[faithfulness-in-ai]] — AI 忠实性
- [[intraview|IntraView]] — 内容锚定的具体任务实例

View File

@@ -0,0 +1,17 @@
---
title: "Content Question Answering (CQA)"
type: concept
created: 2026-06-04
tags: [question-answering, nlp, reading-comprehension]
---
# Content Question Answering (CQA)
**定义**:给定一段文本内容和一个问题,从内容中提取或推理出答案的任务。
CQA 是 [[intraview|IntraView]] 所属的任务范式。与开放域 QA 不同CQA 严格限定于提供的内容,不允许引入外部知识。
## 相关概念
- [[intraview|IntraView]] — CQA 在科学文献领域的严格特化
- [[content-grounded-retrieval]] — CQA 的忠实性要求

View File

@@ -0,0 +1,23 @@
---
title: "持续学习 (Continual Learning)"
created: 2026-06-03
updated: 2026-06-03
type: concept
tags: [continual-learning, lifelong-learning, forgetting]
status: placeholder
---
# 持续学习 (Continual Learning)
> ⚠️ 占位符页面 — 待完善
持续学习又名终身学习Lifelong Learning是指模型在连续数据流上逐步学习新知识而不遗忘旧知识的能力。核心挑战是 [[catastrophic-forgetting|灾难性遗忘]]。
在 LLM 的后训练语境中,持续指令微调可能导致已有知识和推理能力的退化。
## 相关概念
- [[catastrophic-forgetting|灾难性遗忘]]
- [[data-replay|数据回放]]
- [[evolving-knowledge-injection|进化知识注入]]
- [[knowledge-retention|知识保留]]

View File

@@ -0,0 +1,50 @@
---
title: "延续价值函数 (Continuation Value Function)"
created: 2026-06-17
updated: 2026-06-17
type: concept
tags: [reinforcement-learning, mdp, theory, value-function]
sources: [raw/papers/chen-bellman-taylor-score-2026.md]
confidence: high
---
# 延续价值函数 (Continuation Value Function)
延续价值函数 `G*_s(x)` 是 [[bellman-taylor-score-decoding|BTSD]] 框架 Taylor 展开的核心对象——它衡量系统在**后动作配置 x** 下的期望下游回报。
## 定义
```
G*_s(x) = E_ξ[ V*( Ξ_s(x, ξ_s) ) ]
```
其中 `x = φ_s(a)` 是后动作配置,`ξ_s` 是外生扰动,`V*` 是最优值函数。
## 在 Q 函数中的作用
Q 函数的分解:
```
Q*(s,a) = ψ_s(a) + γ G*_s(φ_s(a))
^^^^^^^^ ^^^^^^^^^^^^^^^^
即时奖励 延续价值
```
延续价值捕获了动作 a 在未来产生的影响——BTSD 框架的核心就是**用 Taylor 展开近似 G*_s**。
## 性质
- G*_s 的**光滑度**决定了 Taylor 近似的精确度
- 在排队系统中G*_s 通常接近线性 → 一阶 Taylor 几近精确
- 非线性程度越高,需要保留的高阶项越多
- 最优策略的得分 `z* = γ ∇G*_s(x_ref)`**边际延续价值**
## 与策略梯度的区别
标准策略梯度直接优化 V^π → 需要探索复杂的动作空间。BTSD 通过近似 G*_s 将动作选择简化为得分驱动的优化问题。
## 参考
- [[taylor-expansion-q-function|Q 函数 Taylor 展开]]
- [[post-action-configuration|后动作配置]]
- [[bellman-taylor-score-decoding|BTSD]]

View File

@@ -0,0 +1,47 @@
---
title: "连续表征 (Continuous Representation)"
created: 2026-06-17
updated: 2026-06-17
type: concept
tags: [architecture, representation-learning, latent-reasoning]
sources: [raw/papers/zhang-tarpo-2026.md]
confidence: high
---
# 连续表征 (Continuous Representation)
连续表征是 [[latent-reasoning|潜在推理]] 的数学基础——在 LLM 推理中使用高维连续向量而非离散 token 来表示推理状态。
## 形式
在 Transformer 架构中,连续的隐藏状态 `h_t ∈ R^d` 天然存在于每一层的输出中。标准 [[chain-of-thought|CoT]] 将这些 d 维连续向量坍缩为 1 个离散 token而潜在推理直接操作这些连续表征。
## 两种构造方式
### 原始隐藏状态
`u_continuous = h_t`Transformer 最后一层输出)
- 代表:[[coconut|COCONUT]]
- 问题:表征流形不匹配(隐藏状态 ≠ token embedding 空间)
### Token Embedding 混合
`u_continuous = sum w_i * E(v_i)`top-k embedding 加权混合)
- 代表:[[tarpo|TARPO]]、[[hrpo|HRPO]]
- 优势:与 token embedding 空间一致,缓解流形不匹配
## 确定性问题
连续表征是**确定性的**(给定相同输入,输出相同向量),这与离散 token 采样形成根本对立:
- 离散 token 采样:`v ~ Categorical(logits)` → 随机
- 连续表征:`u = f(h)` → 确定性
这种确定性限制了 RL 策略探索,催生了 [[reparameterization-exploration|重参数化探索]] 和 [[hybrid-reasoning|混合推理]] 两条解决路线。
## 参考
- [[latent-reasoning|潜在推理]]
- [[soft-token]]
- [[hard-token]]
- [[hybrid-reasoning|混合推理]]

View File

@@ -0,0 +1,53 @@
---
title: "连续时间强化学习 (Continuous-Time RL)"
created: 2026-06-17
updated: 2026-06-17
type: concept
tags: [reinforcement-learning, theory, continuous-control, stochastic-processes]
sources: [raw/papers/tiwari-ticks-to-flows-2026.md]
confidence: high
---
# 连续时间强化学习 (Continuous-Time RL)
连续时间 RL 将强化学习建模为**连续时间随机过程**与传统的离散时间步ticks范式相对——正如标题 "From Ticks to Flows" 所暗示的。
## 动机
标准 RL 在离散时间步上操作agent 观察状态、采取动作、接收奖励、转移到下一状态。连续时间 RL 将这一切建模为在**连续时间域 `t ∈ [0, T)`** 上展开的随机过程。这之所以有用,是因为:
1. **数学工具丰富**:可以使用 [[stochastic-differential-equation|SDE]] 理论和 [[ito-calculus|Itô 微积分]] 进行精确分析
2. **自然建模**:许多物理系统本身是连续时间的
3. **理论桥梁**:将 RL 与随机控制和最优控制理论连接
## 控制仿射 MDP
[[ticks-to-flows|Tiwari et al. (2026)]] 在[[control-affine-mdp|控制仿射 MDP]] 中定义连续时间 RL
```
ds_t = (g(s_t) + h(s_t) a_t) dt + σ(s_t) dw_t
```
- `g(s)`自治动力学drift 函数)
- `h(s)`:动作对状态的线性影响
- `σ(s)`:环境噪声([[wiener-process|Wiener 过程]]驱动)
## 值函数
连续时间下的值函数为积分形式:
```
v^π(s, t) = E[∫_t^T e^{-β(l-t)} r(s_l^π) dl | s_t = s]
```
## 与前一个 TARPO 论文的关联
[[tarpo|TARPO]] 使用离散时间 RLGRPOTiwari et al. 的连续时间公式化提供了一个互补的理论视角——两者都致力于理解 RL 的学习动态,但一个从算法层面,一个从随机过程理论层面。
## 参考
- [[stochastic-differential-equation|SDE]]
- [[two-time-scale-process|双时间尺度过程]]
- [[wiener-process|维纳过程]]
- [[ticks-to-flows|Ticks to Flows]]
- [[reinforcement-learning|强化学习]]

View File

@@ -0,0 +1,57 @@
---
title: "控制仿射 MDP (Control-Affine MDP)"
created: 2026-06-17
updated: 2026-06-17
type: concept
tags: [reinforcement-learning, control-theory, theory]
sources: [raw/papers/tiwari-ticks-to-flows-2026.md]
confidence: high
---
# 控制仿射 MDP (Control-Affine MDP)
控制仿射 MDP 是 [[ticks-to-flows|Ticks-to-Flows]] 定义的**连续时间、连续状态-动作空间的 MDP**——其中动作对动力学的影响是**线性(仿射)**的,但环境和奖励可以是高度非线性的。
## 形式化定义
M = (S, A, ⟨g, h, σ⟩, r, s₀, β),其中:
```
ds_t = (g(s_t) + h(s_t) a_t) dt + σ(s_t) dW_t
```
- `g: R^{ds} → R^{ds}`:自治动力学(不受控的 drift
- `h: R^{ds} → R^{ds×da}`**控制仿射项**(动作线性进入动力学)
- `σ: R^{ds} → R^{ds×ds}`:环境噪声(与动作无关)
- `r: R^{ds} → R`:光滑奖励函数
- β ∈ (0,1):折扣因子
## "控制仿射"的含义
动力学中动作 `a_t` 以**线性**方式出现(通过 `h(s_t)a_t`),但 `g`, `h`, `σ`, `r` 都可以是**非线性光滑函数**。这种结构:
- 比一般非线性控制更容易分析
- 涵盖了绝大多数物理控制问题
- 使得探索动力学分析更易处理
## 假设条件
- **光滑性**g, h, σ, r 无限可微
- **Lipschitz 连续性**:保证 SDE 解的存在唯一性
- **策略可允许性**:策略需光滑 + Lipschitz保证封闭系统 SDE 的适定性)
## 与离散 MDP 的对比
| 维度 | 标准 MDP | 控制仿射 MDP |
|------|---------|-------------|
| 时间 | 离散 t=0,1,2... | 连续 t∈[0,T) |
| 转移 | P(s'|s,a) | SDE ds/dt |
| 奖励 | r(s,a) | r(s) (状态依赖) |
| 控制结构 | 任意 | 仿射 (g + h·a) |
## 参考
- [[continuous-time-rl|连续时间 RL]]
- [[stochastic-differential-equation|SDE]]
- [[linear-quadratic-regulator|LQR]]
- [[ticks-to-flows|Ticks to Flows]]

View File

@@ -0,0 +1,30 @@
---
title: "Controlled Text Generation"
created: 2026-06-01
updated: 2026-06-01
type: concept
tags: [steering, llm, controllability]
sources: [raw/papers/xu-why-steering-works-2026.md]
---
# Controlled Text Generation受控文本生成
> 占位符页面 — 待扩展
## 概述
受控文本生成指在 LLM 推理时约束生成过程以强制或偏向特定属性(如情感极性、安全合规、个性倾向)。
## 核心问题
- 控制强度 vs 生成质量折衷([[preference-utility-analysis]]
- 评估困难:输出级度量可能混淆概念信号
- 方法碎片化:不同干预形式缺乏统一比较
## 相关概念
- [[model-steering]]
- [[activation-steering]]
- [[preference-utility-analysis]]
- [[split-steering]]
- [[xu-why-steering-works]]

View File

@@ -0,0 +1,51 @@
---
title: "代价感知基准评测 (Cost-Aware Benchmarking)"
created: 2026-06-15
updated: 2026-06-15
type: concept
tags: [benchmark, evaluation, cost]
sources: [raw/papers/zheng-claw-swe-bench-2026.md]
---
# 代价感知基准评测 (Cost-Aware Benchmarking)
## 定义
Cost-Aware Benchmarking 是将端到端运行代价API 费用、token 用量、wall-clock 时间、缓存命中率)作为**与准确率并列的第一等评测轴**的基准评测方法论。Claw-SWE-Bench 将其内建于 benchmark 设计,而非作为附属日志。
## 为什么需要
传统的 SWE-bench 风格评测仅报告 Resolved Rate / Pass@1。这导致:
- 奖励更长探索和更高预算的系统
- 更便宜但更脆弱的系统被误解
- 无法判断准确率差异是否值得代价差异
**准确率和代价不同步移动。** 真实编程 agent 不是单次模型调用——它反复读文件、编辑代码、运行命令、等待远程模型响应。
## 报告的代价指标
| 指标 | 含义 |
|------|------|
| Total Cost (USD) | 完整运行的 API 总费用 |
| Mean Wall-Clock Duration | 平均墙钟时间(含远程 API 延迟) |
| Input/Output Tokens | 输入/输出 token 用量 |
| Cache Hit Rate | 缓存命中率(影响实际 API 费用) |
## 实验证据:代价差异
在 OpenClaw × 9 模型扫掠中:
- GPT 5.5: 78.0% Pass@1, **$1,399**
- Claude Opus 4.7: 77.1%, **$1,082**
- DeepSeek-V4 Pro: 71.7%, **$81**
- DeepSeek-V4 Flash: 70.3%, **$8.2**
相似准确率的代价可能相差 **170 倍**GPT 5.5 vs DeepSeek-V4 Flash
## 缓存命中率 ≠ 能力指标
缓存命中率影响代价但不应视为能力指标——它取决于 provider 缓存策略、adapter 调用路径和上下文重用策略。应作为代价会计的诊断字段报告。
## 参考
- [[claw-swe-bench|Claw-SWE-Bench 论文]]
- [[pareto-frontier-evaluation|Pareto 前沿评测]]
- [[claw-swe-bench-lite|Claw-SWE-Bench Lite]]

View File

@@ -0,0 +1,55 @@
---
title: "可数与不可数无穷"
created: 2026-06-07
updated: 2026-06-07
type: concept
tags: [集合论, 无穷, 数学基础]
---
# 可数与不可数无穷
[[infinity-hierarchy|无穷层级体系]] 中最基本的一对概念可数无穷countable infinity与不可数无穷uncountable infinity。二者的区分是集合论的核心起点。
## 可数无穷
一个集合是**可数的**countable当且仅当其元素可以与自然数集 $\mathbb{N}$ 建立一一对应。
### 可数集的例子
- 自然数 $\mathbb{N}$
- 整数 $\mathbb{Z}$
- 有理数 $\mathbb{Q}$
- [[algebraic-numbers-countability|代数数]] — 狄德金1873年证明
### 关键直觉
可数无穷意味着你可以**逐一列举**集合中的所有元素(尽管需要无穷多时间)。存在一种明确的枚举顺序,确保没有元素被遗漏。
## 不可数无穷
一个集合是**不可数的**uncountable当且仅当其元素"多于"自然数,无法与 $\mathbb{N}$ 建立一一对应。
### 不可数集的例子
- 实数 $\mathbb{R}$ — 康托尔1874年证明
- 无理数
- 任意区间 $[0, 1]$ 中的实数
### 关键直觉
无论你如何试图枚举实数总有一些实数被遗漏。康托尔的对角线论证Cantor's diagonal argument是这一结论的经典证明。
## 数学意义
这两个概念的区分彻底改变了数学:
- 在此之前,"无穷"是一个模糊的、令人回避的概念
- 康托尔和狄德金证明:无穷有结构,可以严格比较大小
- 这为 [[set-theory-history|集合论]] 的建立铺平了道路
## 相关条目
- [[infinity-hierarchy|无穷层级体系]]
- [[algebraic-numbers-countability|代数数的可数性]]
- [[set-theory-history|集合论史]]
- [[georg-cantor|格奥尔格·康托尔]]

51
concepts/critpt.md Normal file
View File

@@ -0,0 +1,51 @@
---
title: "CritPt (Critical Point Benchmark)"
created: 2026-06-14
updated: 2026-06-14
type: concept
tags: [benchmark, physics, reasoning, frontier]
sources: [raw/papers/procedural-skills-to-strategy-genes-2026.md]
---
# CritPt (Critical Point Benchmark)
前沿物理学研究基准,由 Zhu et al. (2025) 构建,用于探测 AI 推理的"临界点"。Wang et al. (2026) 将其用作基因进化系统的外部验证基准。
## 在 Skills to Strategy Genes 中的作用
CritPt 被用作 [[evolution-probe|进化探针]] 的外部验证gene-evolved 系统是否能在**不同于训练分布的挑战性基准**上展现出实质性改进?
## 关键结果
两个基于 Gene 的进化系统在两个版本的 Evolver 上运行:
| 系统 | 基础模型 | 进化后 | 提升 |
|------|---------|--------|------|
| Evolver 2026-02-16 | Gemini 3 Pro Preview | 18.57% (from 9.1%) | +9.47pp |
| Evolver 2026-03-26 | Gemini 3.1 Pro Preview | 27.14% (from 17.7%) | +9.44pp |
### 上下文对比
- GPT-5.4 Pro (xhigh): 30.0%
- GPT-5.4 (xhigh): 27.14%
- Evolver 2026-03-26: 27.14%
- Gemini 3Deep Think: 25.7%
- Claude Opus 4.6 (max): 12.6%
- Claude Sonnet 4.5 (max): 3.1%
基因进化的系统达到了与 GPT-5.4 (xhigh) 并列的水平,显著超越基础模型。
## 进化轨迹
### 版本 A (2026-02-16): 记忆根植的进化
主要增益来自将先前失败、执行轨迹和修正经验巩固为可复用控制单元。代表性基因:`gene_gep_repair_from_errors`(触发于 error/exception/failed 信号的结构化修复循环)。
### 版本 B (2026-03-26): 探索增强的进化
210 个 gene slot36 个唯一 gene ID。以 arXiv 衍生基因 (148 次选择) 为主。最具代表性的是 `gene_topic_hamiltonian_inverse_design`25 次选择):将紧凑的任务导向解决过程保留为可复用资产。
## 参考
- [[procedural-skills-to-strategy-genes|Skills to Strategy Genes]] — 使用 CritPt 验证进化
- [[evolution-probe|进化探针]] — CritPt 实验所属探针
- [[strategy-gene|策略基因]] — 进化单元
- [CritPt 原论文](https://arxiv.org/abs/2509.26574)

View File

@@ -0,0 +1,46 @@
---
title: "Cross-Model Harness Transfer跨模型 Harness 迁移)"
created: 2026-06-11
updated: 2026-06-11
type: concept
tags: [agent, harness, transfer, generalization]
sources: [raw/papers/xu-life-harness-runtime-adaptation-2026.md]
confidence: high
---
# Cross-Model Harness Transfer
> 在一个模型上进化出的 Runtime Harness直接复用于其他模型架构——无需重新训练或适配。
## 核心发现
Life-Harness 的实验揭示了一个关键性质:
- **源模型**:仅在 Qwen3-4B-Instruct 上进化 Harness
- **目标**17 个其他模型指令微调、推理、Agent 专用模型)
- **结果**116/126 模型-环境组合设臵提升,平均相对增益 88.5%
Harness 跨模型有效,因为它捕获的是**环境侧的可复用结构**(工具契约、合法动作集、退化模式),而非**模型侧的行为特征**。
## 为什么能跨模型迁移
确定性 Agent 环境的"规则"与模型无关:
- Tool Schema 对 Qwen 和 DeepSeek 都一样
- 合法动作集不随模型而变化
- 轨迹退化模式(重复/停滞)是环境动态的产物,非模型的产物
- 反馈格式由环境定义
Harness 将这些规则从"隐性(需要模型学会)"变为"显性(在接口层强制执行)",因此**消除而不是包装了模型差异**。
## 与 Parameter Adaptation 的对比
| 维度 | Parameter Adaptation | Harness Transfer |
|------|---------------------|------------------|
| 跨模型需重训 | 是(换模型 = 重新 SFT/RL | 否Harness 不动) |
| 适配对象 | 模型的行为分布 | 环境的规则结构 |
| 典型成本 | Compute heavy | 轨迹收集 + Coding Agent |
## 参考
- [[xu-life-harness|Life-Harness 论文]]
- [[runtime-interface-adaptation|Runtime Interface Adaptation]]
- [[harness-evolution|Harness Evolution]]

View File

@@ -0,0 +1,42 @@
---
title: "Cross-Section Synthesis — Information Integration Across Document Parts"
type: concept
created: 2026-06-04
tags: [information-retrieval, document-processing, synthesis]
sources: ["ma-intragent-2026"]
---
# Cross-Section Synthesis跨节综合
**定义**:从文档的多个非相邻章节中提取信息并将其综合为连贯答案的能力——这是 [[intraview|IntraView]] 任务的关键挑战之一。
## 为什么重要
科学文献中,回答一个查询往往需要跨越多个章节:
- **方法论**章节描述实验设置
- **结果**章节报告关键数值
- **讨论**章节提供解释和局限性
传统的检索系统按"最相关片段"返回结果,无法跨节关联这些分散的信息。
## IntrAgent 的实现
[[intragent|IntrAgent]] 通过两个机制实现跨节综合:
1. **短期记忆累积**[[iterative-reading|迭代阅读]] 过程中逐步收集的细节 `{D₁, ..., Dₘ}` 存储在短期记忆中
2. **推迟合成**:在 [[sufficiency-check|充分性检查]] 确认足够的跨节证据后才进行最终答案合成
## 典型查询模式
| 查询类型 | 需要的章节 |
|---------|-----------|
| 实验参数 | 方法 + 补充材料 |
| 性能比较 | 结果 + 相关工作 |
| 限制条件 | 讨论 + 方法假设 |
| 数值确认 | 结果表格 + 方法中的定义 |
## 相关概念
- [[iterative-reading]] — 支持跨节累积的阅读机制
- [[sufficiency-check]] — 确保跨节证据充分
- [[intraview|IntraView]] — 跨节综合是核心挑战

View File

@@ -0,0 +1,24 @@
---
title: "数据增强 (Data Augmentation)"
created: 2026-06-03
updated: 2026-06-03
type: concept
tags: [data-augmentation, training, NLP]
status: placeholder
---
# 数据增强 (Data Augmentation)
> ⚠️ 占位符页面 — 待完善
数据增强是通过对原始数据施加变换来扩充训练数据的技术。在 NLP 领域包括同义词替换、回译、文本扰动等方法。
在知识注入场景中分为两类:
- [[knowledge-agnostic-augmentation|知识无关增强]]:不依赖外部知识的通用增强
- [[knowledge-aware-augmentation|知识感知增强]]:利用领域知识的定向增强
## 相关概念
- [[knowledge-agnostic-augmentation|知识无关增强]]
- [[knowledge-aware-augmentation|知识感知增强]]
- [[kore-augmentation|KORE 增强]]

41
concepts/data-wall.md Normal file
View File

@@ -0,0 +1,41 @@
---
title: "数据墙 (Data Wall)"
created: 2026-06-08
updated: 2026-06-08
type: concept
tags: [LLM, scaling-law, training-data, data-bottleneck]
sources: [raw/articles/lecun-llm-boundary-future-2026.md, https://epoch.ai/publications/will-we-run-out-of-data-limits-of-llm-scaling-based-on-human-generated-data]
---
# 数据墙 (Data Wall)
LLM 规模化扩展面临的高质量训练数据即将耗尽的瓶颈。LeCun 将此视为 LLM 架构局限的外部约束之一。
## 量化估算
根据 Epoch AI 的估算:
- 可用于训练的高质量公开人类文本数据:约 **300 万亿 Token**95% CI: 100万亿-1000万亿
- Llama 3-70B 训练数据:约 7000 亿 Token仅 ~1/429
- 在较高过训练倍率下,数据瓶颈可能出现在 **2025-2030**
## 应对策略
1. **版权数据/私有数据授权**:需要高额费用,中小开源项目难以负担
2. **合成数据**:在数学/代码/推理任务中有效,但可能引发[[model-collapse-step|模型崩塌]]——偏差在多轮训练中累积
3. **多模态训练信号**:从代码、视频、机器人交互获取
## 对开源/闭源的差异化冲击
| 闭源 | 开源 |
|------|------|
| 转向版权授权(有钱) | 版权费用难以负担 |
| 合成数据(有隐患) | 合成数据同样受限 |
| 无法接入私域数据 | [[tapestry-federated|Tapestry]] 可接入私域数据而不共享 |
Tapestry 将大量未被纳入模型训练的私域数据通过联邦机制纳入——这些数据闭源方**用钱也买不到**。
## 来源
- [[lecun-llm-boundary-future|原始文章]]
- [[model-collapse-step|模型崩塌]]
- [[tapestry-federated|Tapestry]]

45
concepts/ddcadam.md Normal file
View File

@@ -0,0 +1,45 @@
---
title: "DDCAdam (Dead-Direction-Calibrated Adam)"
created: 2026-06-10
updated: 2026-06-10
type: concept
tags: ["deep-learning", "optimization", "adam", "gauge-symmetry", "fisher-metric"]
sources: ["[[dead-directions-geometric-singular-learning]]"]
---
# DDCAdam (Dead-Direction-Calibrated Adam)
**DDCAdam** 是 [[dead-directions-geometric-singular-learning|Shirodkar (2026)]] 提出的 G-等变 Adam 族预条件子,解决标准 Adam 无法保持 loss 对称性的问题。
## 动机Gauge 商定理
在 G-不变度量上的梯度流下,[[dead-direction|dead direction]] 的速率可传递到商空间 Theta/G
- **SGD** 符合条件(其隐式正则化保持对称性)
- **标准 Adam 不符合**——其逐坐标自适应破坏了 G-等变性
## DDCAdam 的设计
使 Adam 的预条件子与 loss 对称群 G 兼容:
1. 识别网络的对称性结构(缩放、置换等)
2. 构造保持 G-等变性的自适应学习率
3. 在 dead direction 分析中正确传递速率
## 为什么重要
- 标准 Adam 会"干扰"奇异几何——破坏了 dead direction 的自然结构
- DDCAdam 保留了训练轨迹中的奇异几何信息
- 使 [[watanabe-triple|Watanabe 三元组]]的轨迹读取成为可能
## 实践建议
如果使用 Adam 训练网络,且希望进行 SLT 分析:
1. 切换到 DDCAdam保持 G-等变性)
2. 或使用 SGD + momentum
3. **不要**使用标准 Adam——它会破坏奇异几何信号
## 参考
- [[dead-directions-geometric-singular-learning|Dead Directions]]
- [[dead-direction|Dead Direction]]
- [[watanabe-triple|Watanabe's Triple]]
- [[fisher-information-metric|Fisher Information Metric]]

View File

@@ -0,0 +1,52 @@
---
title: "死方向 (Dead Direction)"
created: 2026-06-10
updated: 2026-06-10
type: concept
tags: ["singular-learning-theory", "information-geometry", "fisher-metric", "deep-learning-theory"]
sources: ["[[dead-directions-geometric-singular-learning]]"]
---
# 死方向 (Dead Direction)
**Dead Direction** 是 [[dead-directions-geometric-singular-learning|Shirodkar (2026)]] 提出的桥接原语Fisher 信息度量退化方向上的单位向量,连接 [[singular-learning-theory|奇异学习理论]]和[[information-geometry|信息几何]]。
## 两大解读
| 框架 | 解读 |
|------|------|
| Amari 信息几何 | Fisher 度量 F 失去非退化性的方向 |
| Watanabe 奇异学习理论 | 解析奇异集 Sigma_T 的切向量,具有确定的 KL 阶 k |
两者命名**同一向量**——这是桥接的关键。
## 形式化定义
沿路径 theta(t) → 奇异集t → 0方向 u 满足:
```
u^T F(theta(t)) u → 0 as t → 0
```
## 核心定理Theorem 2
```
u^T F(theta(t)) u = Theta(t^{2(k-1)})
```
其中 k 是 KL 阶。最小 Fisher 特征值的衰减斜率直接读出 k
- k=1正则斜率 0
- k=2斜率 2
- k=3斜率 4
## 为什么重要
1. **无需广中平祐消解**KL 阶在原始参数坐标中可计算
2. **连接两大传统**Amari 的退化方向 = Watanabe 的切向量
3. **实践可操作**:可从单个 checkpoint 的梯度信息中提取
## 参考
- [[dead-directions-geometric-singular-learning|Dead Directions]]
- [[kl-order|KL Order]]
- [[fisher-information-metric|Fisher Information Metric]]
- [[singular-learning-theory|Singular Learning Theory]]

View File

@@ -0,0 +1,50 @@
---
title: "深度高斯过程 (Deep Gaussian Process)"
created: 2026-06-17
updated: 2026-06-17
type: concept
tags: [bayesian-deep-learning, gaussian-process, hierarchical-models]
sources: [raw/papers/ortega-phd-thesis-2026.md]
confidence: high
---
# 深度高斯过程 (Deep Gaussian Process)
深度高斯过程 (DGP) 将 GP 推广为**层次化组合**——每一层的输出作为下一层的输入,表达力远超单层 GP。[ortega-phd-thesis|Ortega (2026)] 提出的 [[deep-variational-implicit-process|DVIP]] 是 DGP 的高效替代方案。
## 定义
```
f_L ∘ f_{L-1} ∘ ... ∘ f_1(x), f_l ~ GP(m_l, k_l)
```
每一层 `f_l` 本身是一个高斯过程。
## 优势 vs 浅层 GP
| 维度 | 浅层 GP | DGP |
|------|--------|-----|
| 表达能力 | 核函数决定 | 层次化组合 |
| 非平稳性 | 需特殊设计 | 自然涌现 |
| 多尺度 | 单尺度 | 每层捕获不同尺度 |
## 计算挑战
DGP 的推断代价高:
- 隐层无观测 → 需要近似推断
- 变分推断需大量 inducing points
- 计算复杂度 O(NM^2) 量级
## DVIP 作为替代
DVIP 用 [[implicit-processes|隐式过程]] 替代 GP
- 保留 DGP 的层次结构
- 降低约 10 倍计算代价
- 允许非高斯先验
## 参考
- [[deep-variational-implicit-process|DVIP]]
- [[implicit-processes|隐式过程]]
- [[function-space-modeling|函数空间建模]]
- [[ortega-phd-thesis|论文]]

View File

@@ -0,0 +1,50 @@
---
title: "扩展深度强化学习 (Scaling Deep RL)"
created: 2026-06-10
updated: 2026-06-10
type: concept
tags: ["deep-rl", "scaling-laws", "multitask-learning"]
sources: ["[[predictive-representations-scalable-mtrl]]"]
---
# 扩展深度强化学习 (Scaling Deep RL)
**Scaling Deep RL** 关注如何通过增加模型容量、数据量和任务多样性来持续提升RL性能——类似于语言和视觉领域的 scaling laws 研究。
## 核心挑战
与监督学习不同RL 的 scaling 面临独特障碍:
1. **非平稳数据**:策略更新 → 数据分布变化
2. **Bootstrapping**TD 目标的递归性质放大误差
3. **表征崩溃**:大模型在稀疏信号下出现死神经元
4. **损失可塑性**:持续训练导致网络失去学习能力
## 关键发现
[[predictive-representations-scalable-mtrl|Obando-Ceron et al. (2026)]] 的核心 scaling 发现:
- **无预测表征**:模型增大 → 性能持平或退化
- **有预测表征**:模型增大 → 持续性能提升
**表征质量是 scaling 的瓶颈**,而非模型容量本身。
## 与 LLM/Vision Scaling 的对比
| 维度 | LLM/Vision | Deep RL |
|------|-----------|---------|
| 数据 | 静态语料库 | 在线交互 |
| 监督 | 密集 | 稀疏/非平稳 |
| 目标 | 静态 | Bootstrapped |
| Scaling 瓶颈 | 数据量 | **表征质量** |
## 实践意义
1. 扩大模型前,先确保表征学习机制到位
2. [[predictive-representation-learning|预测目标]]是低成本、高回报的 scaling 杠杆
3. Wall-clock 效率应与样本效率并重
## 参考
- [[predictive-representations-scalable-mtrl|Scalable Multitask Deep RL]]
- [[predictive-representation-learning|Predictive Representation Learning]]
- [[multitask-rl|Multitask RL]]

View File

@@ -0,0 +1,43 @@
---
title: "深度变分隐式过程 (DVIP)"
created: 2026-06-17
updated: 2026-06-17
type: concept
tags: [bayesian-deep-learning, variational-inference, implicit-processes, gaussian-process]
sources: [raw/papers/ortega-phd-thesis-2026.md]
confidence: high
---
# 深度变分隐式过程 (Deep Variational Implicit Process)
DVIP 是 [[ortega-phd-thesis|Ortega (2026)]] 提出的可扩展 Bayesian 框架——将[[implicit-processes|隐式过程]]扩展到深度架构,在函数空间中建模可采样但无显式密度的分布。
## 动机
- [[deep-gaussian-process|深度高斯过程 (DGP)]] 表达力强但计算代价高
- 隐式过程允许**非高斯先验**和**高效变分推断**
- 关键挑战:如何将隐式过程与深度架构结合
## 核心思想
DVIP 定义深度隐式过程为:
```
f(x) = f_L ∘ f_{L-1} ∘ ... ∘ f_1(x)
```
其中每一层 `f_l` 是一个隐式过程——可从先验采样(通过噪声→函数的确定映射),但无显式概率密度。
## 优势
- 非高斯先验:比 GP 更表达
- 函数空间变分推断:直接在函数分布上优化
- 计算高效DGP 的约 1/10 代价
- 可扩展:适用于现代深度架构
## 参考
- [[implicit-processes|隐式过程]]
- [[deep-gaussian-process|深度高斯过程]]
- [[function-space-modeling|函数空间建模]]
- [[ortega-phd-thesis|论文]]

28
concepts/deepseek-r1.md Normal file
View File

@@ -0,0 +1,28 @@
---
title: "DeepSeek-R1"
created: 2025-06-02
updated: 2025-06-02
type: concept
tags: [reasoning-model, llm, deepseek, placeholder]
sources: []
---
# DeepSeek-R1
> DeepSeek 发布的开源推理模型Guo et al., 2025通过强化学习激励推理能力在多个基准上达到领先水平。
## 核心特点
- 基于 RL 的推理能力训练(非 SFT
- 生成显式推理 tokenthinking tokens随后生成回复
- 主要基于单轮推理数据训练
## 在多轮推理中的局限
[[goru-one-pass-to-reason-2025]] 指出DeepSeek-R1 遵循行业惯例——推理 token 在后续轮次中被丢弃,导致多轮微调效率低下(需 N 遍前向传播)。
## 相关
- [[goru-one-pass-to-reason-2025|One-Pass to Reason]]
- [[multi-turn-reasoning]]
- [[visibility-constraint]]

View File

@@ -0,0 +1,41 @@
---
title: "Deterministic Agent Failures确定性 Agent 失败分类)"
created: 2026-06-11
updated: 2026-06-11
type: concept
tags: [agent, failure-analysis, deterministic, taxonomy]
sources: [raw/papers/xu-life-harness-runtime-adaptation-2026.md]
---
# Deterministic Agent Failures
> 在确定性、规则驱动的 Agent 环境中,失败可以系统性地分类为四大类型——不同类型的失败需要不同阶段的接口干预。
## 四类失败
基于 Life-Harness 在 Qwen3-4B-Instruct 上的手动失败诊断393 个失败 episode
| 类型 | 占比 | 定义 | 对应 Harness 层 |
|------|------|------|----------------|
| **动作实现失败** | ~23% | 模型意图合理,但动作格式不可执行(自由文本代替 tool call、缺失参数 | [[action-realization-layer\|动作实现层]] |
| **环境契约不匹配** | ~33% | 动作语法正确但违反工具使用的调用协议或策略约束 | [[environment-contract-layer\|环境契约层]] |
| **轨迹退化** | ~17% | 单步有效但整体陷入重复、停滞或无效恢复循环 | [[trajectory-regulation-layer\|轨迹调控层]] |
| **一般推理失败** | ~27% | 推理、计算或决策本身错误,尽管基本遵循了协议 | 超出 Harness 范围,需模型改进 |
## 关键洞察
四类失败的分布**因环境而异**——不同 benchmark 的主导失败模式差异很大:
- ALFWorld动作实现 + 轨迹退化占主导
- WebShop环境契约匹配更关键
- OS/DBBench分布更均匀
这意味着:**没有万能的一层 Harness**——需要多层协同覆盖。
## 诊断方法
对每个失败 episode按最早主导瓶颈分配类别见论文 Appendix A.1 的详细分类规则)。
## 参考
- [[xu-life-harness|Life-Harness 论文]]
- [[runtime-harness-adaptation|Runtime Harness Adaptation]]
- [[harness-evolution|Harness Evolution]]

View File

@@ -0,0 +1,44 @@
---
title: "Differentiable Token Budgeting"
created: 2026-06-05
updated: 2026-06-05
type: concept
tags: [token-economics, frontier, differentiable, agent]
sources: [[chen-token-economics-llm-agents]]
---
# Differentiable Token Budgeting
**可微分 Token 预算**是 Token Economics 五大前沿方向之一O1主张将 Token 预算从一个**外生参数**转变为一个**可学习的、可微分的参数**,使 Agent 能通过梯度优化自动学习最优的 Token 分配策略。
## 动机
当前的 Token 预算管理是硬编码的:
- 固定上下文窗口截断
- 手动设定的 CoT 步骤上限
- 静态的工具调用次数限制
这些硬约束忽略了任务间的异质性:简单任务被分配过多 token 造成浪费,复杂任务被截断导致失败。
## 核心理念
```
Budget = f_θ(task_complexity, quality_target, cost_constraint)
```
使用可学习的函数 f_θ参数为 θ),根据任务特征动态预测最优 Token 预算。通过将预算分配与最终任务质量建立可微连接,用梯度下降优化 θ。
## 关键挑战
| 挑战 | 描述 |
|------|------|
| **离散性** | Token 预算是离散的——需要离散优化或连续松弛 |
| **因果链长度** | 预算 → 生成 → 质量之间的因果链太长,梯度信号稀疏 |
| **分配粒度** | 预算需要在 token 类型之间分配(推理/记忆/工具),而非单一数字 |
| **在线适应** | 预算预测需要适应执行过程中的新信息 |
## 与相关概念的连接
- [[agent-token-budget-optimization|Token 预算优化]] 解决静态预算下的最优分配,可微预算解决预算本身的动态确定
- [[token-efficiency|Token 效率]] 的目标(更少 token 同等质量)是可微预算的优化信号
- [[micro-level-token-economics|微观 Token 经济学]] 的要素替代问题在可微预算下不再需要人工设定替代弹性

View File

@@ -0,0 +1,48 @@
---
title: "扩散时间点过程 (Diffusion-based TPP)"
created: 2026-06-16
updated: 2026-06-16
type: concept
tags: [temporal-point-process, diffusion-models, generative-modeling, non-autoregressive]
sources: [raw/papers/advances-temporal-point-processes-2026.md]
---
# 扩散时间点过程 (Diffusion-based TPP)
扩散 TPP 利用扩散模型的迭代去噪机制生成整个事件序列提供了一种非自回归non-autoregressive的 TPP 建模范式。
## 核心思想
不同于传统神经 TPP 逐事件自回归预测 `p(t_n | H_{t_{n-1}})`,扩散 TPP 学习整个序列 `T = (t_1,...,t_N)` 的联合分布:
```
T_0 ~ data distribution
T_1, ..., T_K (前向加噪)
p_theta(T_{k-1} | T_k) (反向去噪/生成)
```
## 关键工作
- **Add-and-Thin** (Lüdke et al., 2023):首个扩散 TPP 框架,用点过程特有的"添加"和"thinning"操作替代标准高斯扩散,保留事件序列语义
- **EventFlow** (Kerrigan et al., 2024):用 flow matching 在一次去噪轨迹中预测整个预测窗口内的多个未来事件
- **Spatio-temporal diffusion** (Yuan et al., 2023):联合建模空间和时间的扩散点过程
- **Point set diffusion** (Lüdke et al., 2024):将事件序列视为无序点集,排列不变生成
## 优势与局限
### 优势
- 批量化生成整条序列,避免自回归误差累积
- 天然捕捉事件间的全局依赖
- 适合长程预测和序列模拟
### 局限
- **时序一致性弱**:隐式表征时间信息,难以保证因果顺序
- **训练/推理成本高**:每次生成需数十到数百次去噪步骤
- **缺乏显式似然**:模型评估和校准困难
- **精细时序结构**inter-event 时间分布不如直接参数化精确
## 参考
- [[temporal-point-process|时间点过程]]
- [[neural-temporal-point-process|神经 TPP]]
- [[advances-temporal-point-processes-2026|TPP 综述]]

View File

@@ -0,0 +1,49 @@
---
title: "双下降 (Double Descent)"
created: 2026-06-17
updated: 2026-06-17
type: concept
tags: [theory, generalization, deep-learning, phenomena]
sources: [raw/papers/ortega-phd-thesis-2026.md]
confidence: high
---
# 双下降 (Double Descent)
双下降是深度学习中**模型复杂度增加时测试误差先降、后升、再降**的经验现象——违背经典 U 型曲线的直觉。[[ortega-phd-thesis|Ortega (2026)]] 通过 PAC-Chernoff 界提供了定量解释。
## 三个阶段
```
测试误差
| ↓ (classical)
| ↑ (插值阈值)
| ↓ (过参数化区间)
└──────────────→ 模型复杂度
```
1. **经典区间**:偏差-方差权衡U 型最低点
2. **插值阈值**:模型刚好拟合训练数据 → 误差峰值
3. **过参数化区间**:越过插值 → 误差再次下降
## PAC-Chernoff 解释
传统界在插值区间失效L_train ≈ 0 → bound ≈ ∞。Ortega 的大偏差界:
- **非渐进**:不假设 n→∞
- **率函数**:捕获了损失景观的局部几何
- 在插值点:率函数 I(0) 分母为模型灵活性
- 过参数化后:增加灵活性 → 率函数增大 → 界收紧
## 与三个泛化机制的关联
- **光滑性**:平坦极小值 → 率函数更陡 → 界更紧
- **多样性**:集成 → 有效方差减小
- **随机性**SGD 噪声 → 自然偏向平坦极小值
## 参考
- [[generalization-bounds|泛化界]]
- [[pac-bayesian-bounds|PAC-Bayesian 界]]
- [[ortega-phd-thesis|论文]]

21
concepts/dpo.md Normal file
View File

@@ -0,0 +1,21 @@
---
title: "DPO (Direct Preference Optimization)"
created: 2026-06-03
updated: 2026-06-03
type: concept
tags: [DPO, alignment, LLM, training]
status: placeholder
---
# DPO (Direct Preference Optimization)
> ⚠️ 占位符页面 — 待完善
DPO 是一种直接偏好优化方法,通过重新参数化 RLHF 中的奖励函数,直接从偏好数据中优化策略,无需显式训练奖励模型。是 RLHF 的简化替代方案。
在 [[zhang-reconciling-sft-interaction-2026|Zhang et al. (2026)]] 的讨论中RLHF/DPO 等替代性后训练范式与 SFT 形成对照。
## 相关概念
- [[rlhf]]
- [[supervised-fine-tuning|SFT]]

View File

@@ -0,0 +1,49 @@
---
title: "漂移检测 (Drift Detection)"
created: 2026-06-10
updated: 2026-06-10
type: concept
tags: [observability, llm, monitoring, drift]
sources: [raw/articles/pydantic-three-piece-suite-2026.md]
---
# 漂移检测 (Drift Detection)
> 监控 LLM 输出结构随时间变化的趋势检测技术——在"第 47 次报错"之前,从"第 32 次开始不对劲"时就看到信号。
## 问题
LLM 输出的 JSON 错误模式是**漂移的**而非稳定的:
- 第 1 次:字段名少了下划线
- 第 47 次:多了未定义的字段
- 第 89 次str 类型塞了 None
传统 `model_validate` 只能告诉你某次校验失败,不能告诉你**趋势**——哪些字段一直在漂?哪个模型最不稳定?
## 检测维度
- **字段漂移**:哪些字段的校验失败频率在上升?
- **类型漂移**:哪些字段的类型不匹配越来越频繁?
- **Token 成本漂移**:输出格式崩塌是否伴随 token 消耗激增?
- **Tool 调用漂移**Agent 调用某个 tool 的频率是否异常变化?
## 实现方式
[[logfire|Logfire]] 提供了基于 SQL 查询的漂移检测——不是点按钮过滤,是写 SQL 查 trace
```sql
SELECT tool_name, count(*) as calls
FROM traces
WHERE time_range = '7d'
GROUP BY tool_name ORDER BY calls DESC
```
## 真实案例
Sophos 安全团队Agent 调用某个 tool 的频率从每 50 次推理 1 次涨到每 8 次 1 次——不是业务量涨了,是 Agent 学"聪明"了。传统日志只报告调用成功SQL 查询揭示了频率异常。
## 参考
- [[logfire|Logfire]]
- [[agent-observability|Agent 可观测性]]
- [[structured-output|结构化输出]]

View File

@@ -0,0 +1,41 @@
---
title: "Dynamic Weight Updates"
created: 2026-06-01
updated: 2026-06-01
type: concept
tags: [steering, llm-dynamics, controllability]
sources: [raw/papers/xu-why-steering-works-2026.md]
---
# Dynamic Weight Updates动态权重更新
## 定义
动态权重更新是 Xu et al. (2026) 提出的统一框架,将 LLM 的多种控制方法——局部权重微调、LoRA 和激活导向——表达为同一仿射变换的实例:
$$h_{i+1} = (W + m_1 \Delta W) h_i + (b + m_2 \Delta b)$$
其中 $\Delta W$ 和 $\Delta b$ 是更新项,$m_1, m_2$ 是标量缩放系数。
## 核心洞察
从激活视角看,所有干预方法等价于向激活添加一个变化项:
$$\Delta h = m_1 \Delta W h_i + m_2 \Delta b$$
三种方法仅在**哪个组件被更新**上有所不同:
- **Local Weight**:同时修改 W 和 b
- **LoRA**:通过低秩因子修改 W
- **Steering Vector**:仅修改 b即仅向激活添加偏置方向
## 缩放系数的作用
引入显式缩放系数 $m_1, m_2$ 扩展了传统公式,使干预强度可以连续调节——这是 preferenceutility 统一分析的核心。
## 相关概念
- [[preference-utility-analysis]] — 基于统一视角的控制效果分析
- [[intervention-multiplier]] — 缩放系数 m
- [[lora]] — 低秩权重更新
- [[activation-steering]] — 偏置形式的动态更新
- [[xu-why-steering-works]] — 源论文

View File

@@ -0,0 +1,42 @@
---
title: "Eluder 维度 (Eluder Dimension)"
created: 2026-06-10
updated: 2026-06-10
type: concept
tags: ["statistical-learning-theory", "complexity-measures", "rl-theory"]
sources: ["[[minimax-policy-regret-pomg]]"]
---
# Eluder 维度 (Eluder Dimension)
**Eluder 维度**Russo & Van Roy, 2013是衡量函数类"顺序复杂度"的度量——它刻画了需要多少样本才能在函数类中唯一确定一个函数。
## 直觉
一个函数类有小的 Eluder 维度,意味着如果两个函数在少量精心选择的数据点上一一致,它们就在所有数据点上一一致。换句话说,你不能在其中"躲藏"太久。
## 在策略后悔界中的角色
在 [[minimax-policy-regret-pomg|Arora (2026)]] 的 POMG 分析中Eluder 维度 d_E 出现在 regret 界中:
```
PR(T) = O(sqrt(d_E * T))
```
两类算子的 Eluder 维度:
1. **Stepwise 类** (d_step):单步 OOM 算子差异
2. **Aggregate 类** (d_agg = d_E):整个 episode 的累积差异
## 具体界
| 模型类 | d_E |
|--------|-----|
| Tabular | O(H * |S|^2 * |A| * |B| * |O_A|^k * |O_B|^k) |
| Linear world | O(H * (d_w * |O_A|^k * |O_B|^k + d_adv * |B|)) |
| Low-rank | O(H * (r^2 * (|A|+|B|) * |O_A|^k * |O_B|^k + ...)) |
## 参考
- [[minimax-policy-regret-pomg|Minimax-Optimal Policy Regret in POMGs]]
- [[observable-operator-model|OOM]]
- [[minimax-optimality|Minimax Optimality]]

43
concepts/emmy-noether.md Normal file
View File

@@ -0,0 +1,43 @@
---
title: "埃米·诺特 (Emmy Noether)"
created: 2026-06-07
updated: 2026-06-07
type: concept
tags: [数学家, 抽象代数, 数学史, 20世纪数学]
---
# 埃米·诺特 (Emmy Noether, 18821935)
德国数学家,抽象代数的奠基人之一。她也是揭开[[georg-cantor|康托尔]]与[[richard-dedekind|狄德金]]之间署名争议的关键人物。
## 生平
- 1882年出生于德国埃尔朗根
- 师从数学大师,但在当时女性难以获得正式教职
- 在哥廷根大学工作,深受学生爱戴
- 1933年纳粹上台后作为犹太人被迫流亡美国
- 1935年因癌症去世
## 主要贡献
- **诺特定理**:揭示了对称性与守恒律之间的深刻联系,是理论物理的基石
- **抽象代数**:奠定了现代代数学的基础框架
- **理想论**:在环论中有奠基性贡献
## 与康托尔-狄德金争议的关系
1930年代诺特在整理狄德金遗作全集时偶然发现了狄德金保存的与康托尔的往来信件
- 这些信件揭示了康托尔1874年论文中的代数数可数性证明实为狄德金的贡献
- 狄德金在私人笔记中写道:自己的两个证明"几乎一字不差地以康托尔的名义"发表
诺特与法国哲学家卡瓦利斯合作整理了这些信件于1937年出版。他们选择**不公开指控**康托尔,而是"让信件本身来说明一切"——这是当时的学术荣誉准则。
> "一切真相都写在狄德金的著作之中。" —— 诺特常对学生说的话
## 相关条目
- [[richard-dedekind|里夏德·狄德金]]
- [[georg-cantor|格奥尔格·康托尔]]
- [[mathematical-priority-disputes|数学优先权争议]]
- [[cantor-stole-infinity|窃取无穷的数学家]]

View File

@@ -0,0 +1,42 @@
---
title: "情绪价值评估 (Emotional Value Evaluation)"
created: 2026-06-14
updated: 2026-06-14
type: concept
tags: [evaluation, llm, emotion, finance, user-experience]
sources: [raw/articles/qifu-llm-finance-practice-2026.md]
---
# 情绪价值评估 (Emotional Value Evaluation)
奇富科技王元提出的**大模型在业务场景中的主观质量评估方法**:在金融科技项目中,"情绪价值"往往先于业务效果被感知,呈现"先看着对,后用着有效果"的特点。
## 核心观察
在营销业务中,若 AI 系统无法准确识别并安抚用户情绪,**即便信息准确也会导致体验崩塌**,更别提邀约成功率。情绪价值是业务成功的**必要条件**而非充分条件。
## 评估方法
引入**心理学方法**构建评估器:
- 评估 AI 输出是否"看着对"——语气、共情能力、情绪识别准确度
- 在商业签单阶段优先提供"看着像"的情绪价值
- 再追求邀约成功率等硬指标
## 与传统评估的对比
| 维度 | 情绪价值评估 | 传统准确率评估 |
|------|------------|--------------|
| 评估对象 | 主观体验 | 客观事实 |
| 度量方式 | 心理学量表/打分制 | 准确率/召回率 |
| 业务优先级 | 先验条件 | 后验优化 |
| 对失败的影响 | 直接导致体验崩塌 | 部分影响效率 |
## 实践启示
- 在 B2B 商业签单中,"看起来专业"和"实际上准确"同样重要——前者决定是否给你机会证明后者
- 情绪识别和安抚能力是对话式 AI 在营销场景中的**地基能力**
- 主观性评估采用打分制配合人工抽样检查
## 参考
- [[qifu-llm-finance-practice|奇富科技金融 LLM 实践]] — 来源分享

View File

@@ -0,0 +1,36 @@
---
title: "Environment Contract Layer环境契约层"
created: 2026-06-11
updated: 2026-06-11
type: concept
tags: [agent, harness, contract, interface]
sources: [raw/papers/xu-life-harness-runtime-adaptation-2026.md]
---
# Environment Contract Layer
> Life-Harness 的第①层:在交互开始前,校准并增强模型可见的环境契约,使稳定的环境约束显式化。
## 机制
该层操作在模型开始与环境的交互循环之前,将原始环境契约 C 增强为 C = C ⊕ ΔC其中 ΔC 是从训练轨迹和环境策略中导出的**精简约束更新**。
ΔC 通常包含:
- 工具应如何调用的规范
- 在当前环境协议下哪些动作是合法的
- 环境特定的常见陷阱和避免策略
## 为什么需要
在 Life-Harness 的失败诊断中,**环境契约不匹配Environment Contract Mismatch**占所有失败的约 33%——这是最高频的单一失败类别。Agent 生成了语法正确的工具调用,但违反了环境的调用协议或策略约束。这些问题**无法通过更强的推理能力解决**——需要的是更清晰、更精确的接口约定。
## 与其他层的关系
- 与 [[procedural-skill-layer|程序技能层]] 互补:契约层提供"什么是合法的",技能层提供"怎么做好"
- 为 [[action-realization-layer|动作实现层]] 提供验证依据
- 在 [[runtime-harness-adaptation|Runtime Harness Adaptation]] 中处于优先级最高的位置
## 参考
- [[xu-life-harness|Life-Harness 论文]]
- [[action-realization-layer|动作实现层]]
- [[deterministic-agent-failures|确定性 Agent 失败分类]]

View File

@@ -0,0 +1,40 @@
---
title: "认知不确定性 (Epistemic Uncertainty)"
created: 2026-06-10
updated: 2026-06-10
type: concept
tags: ["uncertainty-quantification", "bayesian-deep-learning", "clinical-ai"]
sources: ["[[principled-uncertainty-clinical-ai]]"]
---
# 认知不确定性 (Epistemic Uncertainty)
**认知不确定性**Epistemic Uncertainty是模型由于知识不足而产生的不确定性可通过增加训练数据来减少。与之相对的是 [[aleatoric-uncertainty|随机不确定性]](数据本身的噪声,不可减少)。
## 形式化定义
在贝叶斯深度学习中,通过 [[mc-dropout|MC Dropout]] 进行 T 次随机前向传播来估计:
方差 = (1/T) * 求和_t [f(z_t) - 均值]^2
其中 z_t 通过重参数化采样z_t = mu_fused + epsilon_t * sigma_fused, epsilon_t ~ N(0, I)
## 临床意义
认知不确定性在临床 AI 中的关键价值:
- **分布外检测**:当患者特征偏离训练分布时(如农村医院患者),认知不确定性自然升高
- **公平性信号**:系统性的认知不确定性差异揭示了模型训练数据的代表性不足
- **人工升级触发**:高认知不确定性指示模型"知道自己不知道",应触发专家审核
## 与其他不确定性的区别
| 类型 | 来源 | 可减少性 | 估计方法 |
|------|------|---------|---------|
| **认知** | 模型知识不足 | 可减少 | MC Dropout 方差 |
| 随机 | 数据噪声 | 不可减少 | 专用输出头 |
## 参考
- [[principled-uncertainty-clinical-ai|Principled Uncertainty in Clinical AI]]
- [[uncertainty-quantification|不确定性量化]]
- [[bayesian-deep-learning|贝叶斯深度学习]]
- [[expected-calibration-error|ECE]]

View File

@@ -0,0 +1,48 @@
---
title: "Epoch-based 乐观 MLE (Epoch-based Optimistic MLE)"
created: 2026-06-10
updated: 2026-06-10
type: concept
tags: ["rl-algorithms", "optimism", "online-learning", "exploration"]
sources: ["[[minimax-policy-regret-pomg]]"]
---
# Epoch-based 乐观 MLE
**Epoch-based Optimistic MLE** 是 [[minimax-policy-regret-pomg|Arora (2026)]] 提出的 POMG 策略后悔最小化算法,核心思想是通过极少次数的策略切换来控制传输成本。
## 算法结构
```
for e = 0, 1, 2, ...:
T_e = 2^e // 几何增长的 epoch 长度
基于累积数据构建 MLE 置信集 C_e
选择乐观策略 pi_e = argmax_{pi, xi in C_e} V^{pi, xi}
执行 pi_e 整个 epoch (T_e episodes)
```
## 关键设计选择
1. **几何增长 epoch**T_e = 2^e
- 仅 O(log T) 个不同策略被部署
- 切换成本保持 polylogarithmic
2. **累积置信集**:每个 epoch 使用所有历史数据构建
- 置信集单调收缩
- 确保乐观性:真实参数以高概率在置信集内
3. **乐观策略选择**:在置信集内最大化价值
- 探索-利用的经典乐观原则
- 配合 [[eluder-dimension|Eluder 维度]]确保高效
## 策略切换的传输成本
在 [[posterior-lipschitz-adversary|Posterior-Lipschitz POMG]] 中每次策略切换会触发对手响应变化。Epoch 结构确保:
- 仅 O(log T) 次切换
- 每次切换的对手适应成本被 Lipschitz 常数控制
- 总传输成本 O(m * H * log T),不破坏 sqrt(T) 速率
## 参考
- [[minimax-policy-regret-pomg|Minimax-Optimal Policy Regret in POMGs]]
- [[policy-regret|Policy Regret]]
- [[eluder-dimension|Eluder Dimension]]

View File

@@ -0,0 +1,76 @@
---
title: "进化探针 (Evolution Probe)"
created: 2026-06-14
updated: 2026-06-14
type: concept
tags: [agent, evolution, experience-accumulation, gene]
sources: [raw/papers/procedural-skills-to-strategy-genes-2026.md]
---
# 进化探针 (Evolution Probe)
Wang et al. (2026) 中设计的第三个分析探针,检验策略基因是否为经验积累和迭代进化提供更好的基底。
## 设计意图
Gene 不仅是一次性控制——它能否作为**持续经验积累和测试时进化的载体**
## 实验规模
1,260 次保留试验。
## 关键发现
### 载体格式效应
同一失败历史附加到不同载体上的效果:
| 条件 | Avg. | Δ |
|------|------|-----|
| 无引导 | 51.0% | 0.0 |
| Gene | 54.0% | +3.0 |
| Gene + failure | 52.0% | +1.0 |
| Freeform + failure | 49.6% | -1.4 |
| Skill + failure | 47.8% | -3.2 |
积累的经验**不是载体中性的**——结构化控制导向对象比文档导向或非结构化文本更好地保留附加信息。
### 可编辑结构 vs 展平散文
| 条件 | Avg. | Δ |
|------|------|-----|
| 无引导 | 51.0% | 0.0 |
| Gene (结构化) | 54.0% | +3.0 |
| Gene (展平散文, 相同内容) | 50.5% | -0.5 |
可编辑结构**超越内容**本身有价值——将 Gene 展平为散文消除了其大部分优势。
### 失败信息编码
| 条件 | Avg. | Δ |
|------|------|-----|
| 无引导 | 49.8% | 0.0 |
| 仅失败警告 | 54.4% | +4.6 |
| 仅策略 | 52.3% | +2.5 |
| 策略优先 | 51.8% | +2.0 |
| 失败优先 | 50.5% | +0.7 |
失败历史**蒸馏为独立紧凑警告**时最有效,而非与策略混合。朴素地将两者打包会削弱双方。
### CritPt 进化
见 [[evolution-probe|进化探针]] 中 CritPt 结果:
- Evolver + Gemini 3 Pro: 9.1% → 18.57% (+9.47pp)
- Evolver + Gemini 3.1 Pro: 17.7% → 27.14% (+9.44pp)
## 核心教训
经验积累应**选择性而非加性**:压缩失败为聚焦警告、保持结构化可编辑性、避免附加性增长模糊控制信号。
## 参考
- [[procedural-skills-to-strategy-genes|Skills to Strategy Genes]] — 包含完整分析
- [[skill-probe|技能探针]] — 第一探针
- [[gene-probe|基因探针]] — 第二探针
- [[critpt|CritPt]] — 外部进化基准
- [[experience-distillation|经验蒸馏]] — 压缩策略

View File

@@ -0,0 +1,41 @@
---
title: "Execution Fidelity"
created: 2026-06-05
updated: 2026-06-05
type: concept
tags: [agent-safety, trajectory-audit, correctness]
sources: [[liu-auditing-agent-harness-safety]]
---
# Execution Fidelity (L2)
**执行忠实度**是 [[agent-harness-safety|Agent 骨架安全]]三层审计框架的第二层L2评估执行轨迹是否通过**有效的中间步骤**达成目标,而非仅检查最终输出 y 是否匹配参考答案。
## 两个评估维度
### Action Validity (AVS)
评估工具选择、参数和目标对象是否正确,冗余操作是否被避免:
- 工具选择是否合适?
- 参数是否准确?
- 目标资源是否在范围内?
- 是否存在不必要的重复步骤?
### Checkpointed Task Completion (TCR)
从轨迹或环境状态可验证的任务里程碑,而非仅依赖最终输出:
- 每个检查点有独立权重 w_m 和评分 s_m
- 得分 = min(1, Σ w_m × s_m)
- 权重高的检查点对应关键子任务(如"成功查询数据库"
## L2 的独特价值
与 L1 [[boundary-compliance]] 不同L2 关注的是**过程正确性**而非**权限合规**。一个轨迹可以:
- L1 ✓(所有操作都在权限内)但 L2 ✗(操作顺序错误、检查点未完成)
- L1 ✗(访问了越权资源)但 L2 ✓(任务客观上完成了)
只有 L1 和 L2 **同时通过**,骨架执行才被认为是既安全又有效的。
## 实验发现
HarnessAudit 实验揭示了一个关键的反直觉现象:**任务完成能力与安全合规是负相关的**。Gemini 3.1 Pro 的任务完成率 (TCR) 并非最高,但凭借最强的安全合规获得了最高总体分;而 Claude Opus 4.6 的 TCR 更高,但安全指标明显更弱。这表明更强的任务能力并不自动转化为更可靠的执行过程。
L2 的评测采用混合协议:确定性匹配 + LLM-as-a-JudgeGPT-5.4),后者处理开放式的执行合理性判断。

View File

@@ -0,0 +1,47 @@
---
title: "Execution Harness"
created: 2026-06-05
updated: 2026-06-05
type: concept
tags: [agent-harness, infrastructure, execution-engine]
sources: [[liu-auditing-agent-harness-safety]], [[agent-harness-engineering]]
---
# Execution Harness
**执行骨架**Execution Harness是现代 LLM Agent 的底层运行时基础设施——它不是一个简单的 API wrapper而是一个**策略约束的执行系统**,负责分解目标、分发工具、分配资源和路由消息。
## 核心功能
现代 Agent 骨架OpenClaw、Claude Code、Codex承担以下职责
- **目标分解**:将用户目标拆分为子任务
- **工具分发**:决定 Agent 可调用哪些工具
- **资源分配**控制对数据库、文件系统、API 的访问
- **消息路由**:在多 Agent 之间传递信息和委托任务
- **终止决策**:决定何时执行结束
## HarnessAudit 的形式化
[[harnessaudit|HarnessAudit]] 将执行骨架形式化为 [[policy-constrained-execution|策略约束执行系统]]
```
H := (A, T, R, Π, Φ, Σ)
```
其中核心安全相关的组件是:
- Π(权限策略):工具和资源的访问控制
- Φ信息流策略Agent 间信息共享约束
- Σ(协调协议):任务委托和结果验证
## 安全意义
骨架是 Agent 安全的**天然边界**
- 骨架控制 Agent 的可见工具面——限制了攻击面
- 骨架记录所有工具调用和消息——提供了审计证据
- 骨架执行在 Agent 之外——Agent 无法掩盖其行为
但骨架安全需要**主动设计**当骨架仅关注任务完成而不实施执行级约束时Agent 可以在返回正确答案的同时产生轨迹级安全违规。这就是 [[agent-harness-safety|Agent 骨架安全]] 关注的核心问题。
## 进化谱系
- [[code-as-harness]] → [[harness-as-policy]] → [[harness-as-action-verifier]] → HarnessAudit 的安全审计
- 从"代码即运行环境"到"代码即策略约束"再到"策略约束可以被独立审计"

View File

@@ -0,0 +1,44 @@
---
title: "预期校准误差 (Expected Calibration Error, ECE)"
created: 2026-06-10
updated: 2026-06-10
type: concept
tags: ["uncertainty-quantification", "calibration", "metrics"]
sources: ["[[principled-uncertainty-clinical-ai]]"]
---
# 预期校准误差 (Expected Calibration Error, ECE)
**ECE**Guo et al., 2017是衡量模型概率预测校准质量的标准指标。它度量预测置信度与实际准确率之间的加权平均偏差。
## 形式化定义
将预测按置信度分为 B 个 bin
```
ECE = sum_b (|B_b| / N) * |acc(B_b) - conf(B_b)|
```
- |B_b|/N第 b 个 bin 中样本的比例权重
- acc(B_b):该 bin 中的实际准确率
- conf(B_b):该 bin 中的平均预测置信度
## 解读
- ECE → 0完美校准置信度 = 准确率)
- ECE 高:模型系统性过度自信或信心不足
- 现代深度神经网络普遍校准不良Guo et al., 2017
## 临床 AI 中的 ECE
在 [[principled-uncertainty-clinical-ai|Principled Uncertainty in Clinical AI]] 中,端到端贝叶斯模型达到 ECE = 0.096,表示优秀的校准性能。良好的校准是 [[uncertainty-equity-gap|不确定性公平性差距]] 作为可靠公平性信号的先决条件——如果模型校准差,不确定性度量的公平含义将不可信。
## 相关方法
- Temperature Scaling后校准Guo et al. 2017
- [[bayesian-deep-learning|贝叶斯方法]](内置校准)
- Reliability Diagram校准可视化
## 参考
- [[principled-uncertainty-clinical-ai|Principled Uncertainty in Clinical AI]]
- [[uncertainty-quantification|不确定性量化]]
- [[uncertainty-equity-gap|UEG]]

View File

@@ -0,0 +1,52 @@
---
title: "经验蒸馏 (Experience Distillation)"
created: 2026-06-14
updated: 2026-06-14
type: concept
tags: [agent, experience-reuse, compression, gene]
sources: [raw/papers/procedural-skills-to-strategy-genes-2026.md]
---
# 经验蒸馏 (Experience Distillation)
Wang et al. (2026) 中隐含的核心操作:将丰富的源经验(技能包、轨迹)压缩为紧凑的控制导向表示。
## 蒸馏映射
形式化:给定源经验 z技能 s、轨迹集 H、或已验证的 Capsule C
```
g = psi(z), g in G
```
其中 psi 提取紧凑的控制导向表示。蒸馏不是简单的截断或摘要——它是对经验的**重新抽象**。
## 为什么蒸馏必要
过程技能包含大量文档导向材料overview, API notes, examples, scripts其中仅约 10-15% 提供有意义的控制价值。其余部分在推理时构成**信息过载**。
经验蒸馏的目标:
- 提高**信号密度**(每 token 的控制相关性)
- 明确**适用范围边界**(何时适用、何时不适用)
- 增强**失败显著性**(明确标注 AVOID 项)
## 关键证据
1. **Skill-Workflow (+1.5pp)** 是技能包中唯一明确有用的部分——这恰好是最接近 Gene 策略层的内容
2. **Skill-Overview (-4.7pp)** 是纯文档材料,强烈有害
3. **匹配预算 Skill 片段**改善但仍低于 Gene——蒸馏不只是压缩
4. **失败警告仅 (54.4%, +4.6pp)** 超过所有混合条件——蒸馏应选择性而非加性
## 实践启示
- 蒸馏应从**过程性内容**workflow/strategy而非描述性内容开始
- **AVOID 项**(失败感知线索)是信号密度最高的信息
- 朴素追加更多历史**不会**改善控制——选择性压缩才有
- 蒸馏应保持**结构化可编辑性**,而非展平为散文
## 参考
- [[procedural-skills-to-strategy-genes|Skills to Strategy Genes]] — 蒸馏的实证基础
- [[strategy-gene|策略基因]] — 蒸馏的目标产物
- [[gene-evolution-protocol|GEP]] — 蒸馏的协议化框架
- [[procedural-skill|过程技能]] — 蒸馏的源材料

View File

@@ -0,0 +1,53 @@
---
title: "经验表示 (Experience Representation)"
created: 2026-06-14
updated: 2026-06-14
type: concept
tags: [agent, experience-reuse, representation, formalism]
sources: [raw/papers/procedural-skills-to-strategy-genes-2026.md]
---
# 经验表示 (Experience Representation)
Wang et al. (2026) 将可复用经验视为**经验表示**:从先前问题解决中派生并在测试时重新引入以影响模型行为的外部化对象。
## 形式化
设 H = {tau_i} 为先前问题解决轨迹集。可复用经验表示为:
```
r = phi(H), r in R
```
其中 phi 将先前经验抽象到可复用表示空间 R。给定新任务 x固定模型产生
```
y ~ p_theta(y | x, r)
```
## 两种表示范式的对比
| 维度 | 过程技能 (Skill) | 策略基因 (Gene) |
|------|-----------------|----------------|
| 范式 | 文档导向 | 控制导向 |
| 优化目标 | 可读性、完整性、可维护性 | 信号密度、适用范围、失败显著性 |
| 典型规模 | ~2,500 tokens | ~230 tokens |
| 核心功能 | 教学、审查、传递 | 推理时行为控制 |
| 控制效应 | -1.1pp vs 基线 | +3.0pp vs 基线 |
## 表示作为一阶因素
即使底层经验内容大致相同,**如何包装、结构化和暴露经验给模型**仍会产生实质性差异:
- 技能包的控制价值约 10x 稀释2,500 → 230 tokens 的可用信号)
- Gene 在匹配预算下仍优于缩短的 Skill 片段
- 重新添加文档材料到 Gene 通常降低性能
这表明**经验复用问题的核心不是"提供更多经验",而是"如何编码经验"**。
## 参考
- [[procedural-skills-to-strategy-genes|Skills to Strategy Genes]] — 核心对比
- [[strategy-gene|策略基因]] — 控制导向表示
- [[procedural-skill|过程技能]] — 文档导向表示
- [[test-time-control|测试时控制]] — 表示的预期功能
- [[experience-distillation|经验蒸馏]] — 从丰富源到紧凑表示的过程

View File

@@ -0,0 +1,54 @@
---
title: "探索动力学 (Exploratory Dynamics)"
created: 2026-06-17
updated: 2026-06-17
type: concept
tags: [reinforcement-learning, exploration, stochastic-processes, continuous-control]
sources: [raw/papers/tiwari-ticks-to-flows-2026.md]
confidence: high
---
# 探索动力学 (Exploratory Dynamics)
探索动力学是 [[ticks-to-flows|Tiwari et al. (2026)]] 提出的**连续时间 RL 中的新型探索模型**——通过 [[stochastic-differential-equation|SDE]] 同时编码策略随机性和环境随机性。
## 核心 SDE
```
ds̃^π_t = (g(s̃_t) + h(s̃_t) π(s̃_t)) dt + h(s̃_t) dW'_t + σ(s̃_t) dW_t
```
区别传统加性噪声 `π(s_t) + W_t`
- `h(s_t) dW'_t`**策略噪声**——噪声通过控制通道进入系统
- `σ(s_t) dW_t`**环境噪声**——环境固有随机性
## 关键定理 (Lemma 3.1)
在 Lipschitz 条件下,以上 SDE 的解在分布上**等价于**一个更简洁的 SDE
```
ds̃^π_t = (g + h·π) dt + sqrt(h^2 + σ^2) dW_t
```
这意味着两种噪声源在路径分布上是不可分辨的,但**在离散模拟中对状态-动作覆盖产生不同效果**。
## 与传统加性噪声的对比
| 属性 | 加性 Wiener 噪声 | 探索动力学 |
|------|------------------|-----------|
| 噪声结构 | `π(st) + W_t` | `h(st) dW'_t + σ(st) dW_t` |
| 确定性环境 (σ=0) | 无探索能力 | 仍有探索 |
| 状态-动作覆盖 | 平滑轨迹 | 随机跳跃 |
| 理论可处理性 | 高 | 需要 Lemma 3.1 简化 |
## 在证明中的作用
探索动力学是 Lemma 4.2(值函数 PDE和 Theorem 6.1(梯度时间状态变化)的基础——整个理论分析都在这一动力学模型上构建。
## 参考
- [[continuous-time-rl|连续时间 RL]]
- [[stochastic-differential-equation|SDE]]
- [[wiener-process|维纳过程]]
- [[ticks-to-flows|Ticks to Flows]]

43
concepts/fading-memory.md Normal file
View File

@@ -0,0 +1,43 @@
---
title: "衰减记忆 (Fading Memory)"
created: 2026-06-10
updated: 2026-06-10
type: concept
tags: ["multi-agent-rl", "online-learning", "memory-models"]
sources: ["[[minimax-policy-regret-pomg]]"]
---
# 衰减记忆 (Fading Memory)
**Fading Memory** 是 [[minimax-policy-regret-pomg|Arora (2026)]] 中对有限记忆对手的扩展——允许对手有**无限但几何衰减**的记忆。
## 形式化
对手响应权重随 episode 距离指数衰减:
```
g^t = F(pi^t, gamma * pi^{t-1}, gamma^2 * pi^{t-2}, ...)
```
其中 gamma in (0, 1) 是衰减因子。
## 与有限记忆对比
| 有限记忆 | Fading Memory |
|---------|---------------|
| 只记住最近 m 步 | 记住所有历史但权重衰减 |
| 硬截断 | 软衰减 |
| O(sqrt(T * m)) | O(sqrt(T / (1-gamma))) |
## 算法扩展
Epoch-based 乐观 MLE 的 horizon-adaptive 版本可以处理 fading memory 对手:传输成本分析中,旧 epoch 的影响按 gamma^间隔 衰减,总和仍为 O(1/(1-gamma)),不破坏 sqrt(T) 速率。
## 意义
Fading Memory 在有限记忆和完全无界记忆之间提供了一个平滑的中间地带——在实践中,大多数对手对近期行为的响应远强于对遥远过去的响应。
## 参考
- [[minimax-policy-regret-pomg|Minimax-Optimal Policy Regret in POMGs]]
- [[adaptive-adversary|Adaptive Adversary]]
- [[policy-regret|Policy Regret]]

View File

@@ -0,0 +1,18 @@
---
title: "Faithfulness in AI"
type: concept
created: 2026-06-04
tags: [faithfulness, hallucination, ai-safety, grounding]
---
# Faithfulness in AIAI 忠实性)
**定义**AI 系统输出忠实于输入信息或客观事实的程度——即生成内容是否有据可依,而非凭空编造。
忠实性是 [[content-grounded-retrieval]] 和 [[hallucination-mitigation|幻觉抑制]] 的底层目标。
## 相关概念
- [[hallucination-mitigation]] — 幻觉抑制技术
- [[content-grounded-retrieval]] — 内容锚定检索
- [[sufficiency-check]] — 充分性检查作为忠实性闸门

View File

@@ -0,0 +1,52 @@
---
title: "特征吸收 (Feature Absorption)"
created: 2026-06-17
updated: 2026-06-17
type: concept
tags: [interpretability, sparse-autoencoder, failure-mode, phenomena]
sources: [raw/papers/zhang-geometric-sae-2026.md]
confidence: high
---
# 特征吸收 (Feature Absorption)
特征吸收是 [[sparse-autoencoder|SAE]] 中层级概念学习的**失败模式**——父概念神经元未能对一个子概念的数据点激活,尽管该子概念在语义上属于父概念。
## 形式化
`C_i ⊂ C_j`(子概念 ⊆ 父概念)。理想情况下期望 `θ_{C_i} ⊂ θ_{C_j}`
吸收的数学定义:
```
µ(C_i ∩ θ_{C_j}^c) > 0
```
即父概念神经元 θ_{C_j} 在子概念 C_i 的正测度子集上未能激活。
## 根本原因
[[concept-learning|概念分离]]或近似的稀疏惩罚导致:
- 激活子概念神经元 θ_{C_i} 已消耗稀疏预算
- 同时激活父概念神经元 θ_{C_j} 增加稀疏成本
- SAE 优化选择只激活子概念、跳过父概念
## 几何解释
从 [[geometric-sae-concepts|Zhang et al. (2026)]] 的框架:
- 绝对门控下,父神经元 `H_j^+` 是半空间,本应覆盖子概念
- 但相对门控Top-K子概念的数据点可能未被选入 Top-K
- 层级概念的维护会系统性地增加稀疏成本
## 意义
特征吸收暴露了**稀疏性假设与层级语义之间的结构性张力**——SAE 的稀疏约束天然不利于层级概念的学习。这暗示需要架构创新(如层级 SAE来支持父子概念的共存。
## 参考
- [[feature-splitting|特征分裂]]
- [[feature-family|特征家族]]
- [[sparse-autoencoder|SAE]]
- [[geometric-sae-concepts|几何框架论文]]

View File

@@ -0,0 +1,49 @@
---
title: "特征家族 (Feature Family)"
created: 2026-06-17
updated: 2026-06-17
type: concept
tags: [interpretability, sparse-autoencoder, phenomena]
sources: [raw/papers/zhang-geometric-sae-2026.md]
confidence: high
---
# 特征家族 (Feature Family)
特征家族是 [[sparse-autoencoder|SAE]] 中**一组倾向于协同激活的神经元**——可能代表同一概念的不同方面或语义家族中的邻近概念。
## 形式化
一组特征 `θ₁, ..., θᵣ` 构成家族,若:
```
∩_{l=1}^{r} θ_l ≠ ∅
```
即所有家族成员存在非平凡的共同激活区域。
## 为什么形成
从 [[geometric-sae-concepts|Zhang et al. (2026)]] 的几何视角:
1. **[[feature-splitting|特征分裂]]的中间态**:尚未完全分裂的粗粒度概念
2. **概念的多面性**:同一语义对象有多个可分离的方面
3. **稀疏性下的协同编码**:多个稀疏特征组合表达一个不能由单个特征覆盖的概念
## 与层级概念的关系
特征家族与层级概念hierarchical concepts不同
- **层级概念**`C_child ⊂ C_parent`(子集关系)
- **特征家族**:多个特征描述同一概念的不同维度(非包含关系)
## 意义
特征家族揭示了 SAE 学习表征的**模块性modularity**——模型倾向于用多个独立但协同的特征来表示复杂概念,而非一个全能的"祖母细胞"。
## 参考
- [[feature-splitting|特征分裂]]
- [[feature-absorption|特征吸收]]
- [[sparse-autoencoder|SAE]]
- [[geometric-sae-concepts|几何框架论文]]

View File

@@ -0,0 +1,48 @@
---
title: "特征分裂 (Feature Splitting)"
created: 2026-06-17
updated: 2026-06-17
type: concept
tags: [interpretability, sparse-autoencoder, phenomena]
sources: [raw/papers/zhang-geometric-sae-2026.md]
confidence: high
---
# 特征分裂 (Feature Splitting)
特征分裂是 [[sparse-autoencoder|SAE]] 中最常见的经验现象之一——较小的 SAE 中的粗粒度神经元在较大的 SAE 中**分裂为多个更精细的语义子成分**。
## 形式化
若 θ 是粗神经元,θ₁,...,θᵣ 是分裂后的细粒度神经元:
```
θ ≈ _{j=1}^{r} θ_j, 且 θ_j ∩ θ_l ≈ ∅ (j ≠ l)
```
近似不交性由稀疏约束保证:若分裂神经元大量重叠,数据会同时激活多个神经元,违反稀疏性。
## 必要条件
从 [[geometric-sae-concepts|Zhang et al. (2026)]] 的几何框架:
- 概念必须**非凸到某个正程度**才能分裂(凸概念不可进一步分解)
- 需满足概念分离的几何条件:`Conv(C_j) ∩ Conv(N_j) = ∅`
- 更大的 SAE = 更多的超平面 = 更精细的区域划分能力
## 为什么重要
- **层级概念的自然涌现**"动物" → "哺乳动物" / "爬行动物" → ...
- **解释粒度可调**SAE 大小控制特征粒度
- **证明 SAE 学到的是"真实"结构**而非人工注入
## 注意
[[geometric-sae-concepts|Zhang et al. (2026)]] 证明特征分裂**不具有普遍性**:并非所有概念都能分裂为更细粒度。层级概念(如父子关系)在不改变 SAE 架构的情况下可能难以学习。
## 参考
- [[feature-absorption|特征吸收]]
- [[feature-family|特征家族]]
- [[sparse-autoencoder|SAE]]
- [[geometric-sae-concepts|几何框架论文]]

View File

@@ -0,0 +1,47 @@
---
title: "参数化纤维 (Fiber of Parametrization)"
created: 2026-06-10
updated: 2026-06-10
type: concept
tags: ["neuroalgebraic-geometry", "neural-networks", "identifiability"]
sources: ["[[relu-neuromanifolds-semi-algebraicity]]"]
---
# 参数化纤维 (Fiber of Parametrization)
**参数化纤维** phi^{-1}(phi(u)) 是给定函数 f 的所有参数表示(权重)的集合——即[[parametrization-map|参数化映射]] Phi 的纤维。
## 形式化定义
对于 u in P权重空间模缩放
```
phi^{-1}(phi(u)) = { v in P | phi(v) = phi(u) }
```
纤维包含所有实现相同函数 f_u 的权重参数。
## 纤维大小与对称性
| 纤维大小 | 含义 |
|---------|------|
| = |Pr(d) 轨道| | 仅平凡对称性 — 在 [[honest-open-subset|honest 开子集]]内 |
| > |Pr(d) 轨道| | 存在[[hidden-symmetries-neural|隐藏对称性]] |
| 较大 | 参数冗余度高,可能影响优化 |
## 几何意义
纤维的几何结构反映[[neuromanifold|神经流形]]的局部奇异性:
- 纤维维度恒定 → 神经流形在该区域光滑
- 纤维维度跳跃 → 神经流形的奇点
- 非约化纤维 → 更深层的几何退化
## 商问题
神经流形 M_d 作为集合同构于商 P / E_phi。但在[[semi-algebraic-set|半代数范畴]]中,这个商**不一定存在**——[[relu-neuromanifolds-semi-algebraicity|Flinth et al. (2026)]] 证明了 ReLU 神经流形**不是**半代数商。
## 参考
- [[relu-neuromanifolds-semi-algebraicity|ReLU Neuromanifolds]]
- [[parametrization-map|Parametrization Map]]
- [[neuromanifold|Neuromanifold]]
- [[honest-open-subset|Honest Open Subset]]

View File

@@ -0,0 +1,43 @@
---
title: "Fisher 信息度量 (Fisher Information Metric)"
created: 2026-06-10
updated: 2026-06-10
type: concept
tags: ["information-geometry", "differential-geometry", "statistical-inference"]
sources: ["[[dead-directions-geometric-singular-learning]]"]
---
# Fisher 信息度量 (Fisher Information Metric)
**Fisher 信息度量**是[[information-geometry|信息几何]]的核心对象,量化模型预测对参数移动的敏感度:
```
F(theta) = E_x[ ∂_theta log p_theta(x) · ∂_theta log p_theta(x)^T ]
```
## 几何直觉
- **大的 F 方向**:被数据紧密约束——移动参数 → 预测剧烈变化
- **小的 F 方向**:数据约束弱——参数可自由变化
- **零 F 方向([[dead-direction|Dead Direction]]**参数变化不影响模型输出——Fisher 退化
## 泛化边界中的作用
Fisher 度量在以下公式中自然出现:
- Cramer-Rao 下界
- 自然梯度下降
- 模型选择准则AIC, TIC 中的 Fisher 迹项)
- [[singular-learning-theory|SLT]] 中 RLCT 的计算
## 在深度网络中的退化
过参数化网络在解附近Fisher 度量系统性降秩:
- 退化方向 = 不影响函数的参数方向
- 这些方向构成连续奇异的"平台"
- Shirodkar (2026):退化方向的 Fisher 衰减率编码了 [[kl-order|KL 阶]]信息
## 参考
- [[dead-directions-geometric-singular-learning|Dead Directions]]
- [[information-geometry|Information Geometry]]
- [[dead-direction|Dead Direction]]
- [[singular-learning-theory|Singular Learning Theory]]

View File

@@ -0,0 +1,48 @@
---
title: "五轴位置编码 (Five-Axis Positional Encoding)"
created: 2026-06-13
updated: 2026-06-13
type: concept
tags: [computer-vision, position-encoding, transformer, video-generation]
sources: [raw/papers/cheng-flex4dhuman-2026.md]
---
# 五轴位置编码 (Five-Axis Positional Encoding)
Flex4DHuman 的核心技术创新——将标准 [[rotary-position-embedding|RoPE]] 从三维(时间, 高, 宽)扩展为五维位置编码。
## 定义
五轴位置编码是在自注意力机制中同时编码以下五个维度的位置信息:
- **D_time = 16**: 离散时间帧索引(当前帧在序列中的位置)
- **D_view = 8**: 离散视角槽索引(标识不同相机视点)
- **D_SE(3) = 20**: 连续 SE(3) 相机几何编码
- **D_h = 42**: 空间高度
- **D_w = 42**: 空间宽度
总计注意力头维度 D = 128与原始 Wan 2.1 保持一致。
## 工作机制
在 Wan 2.1 中RoPE 维度分配为 (Dt, Dh, Dw) = (44, 42, 42)。Flex4DHuman 将时间轴容量 44 重新分配为三个子轴:
```
(Dtime, Dview, DSE(3), Dh, Dw) = (16, 8, 20, 42, 42)
```
- **时间帧编码** (16维):区分不同时间步的 token
- **视角编码** (8维):离散视角标识,排列不变性,使模型能泛化到任意数量的参考/目标视角
- **SE(3) 编码** (20维):连续相对相机位姿,通过 [[se3-relative-camera-encoding|SE(3) 相对相机编码]] 实现
## 关键特性
- **零额外参数**:不引入新的可学习权重,仅重新分配已有 RoPE 容量
- **预训练继承**:利用 Wan 2.1 在运动数据上学习到的位置先验
- **排列不变性**:离散视角编码支持任意顺序的输入视角
## 参考
- [[flex4dhuman|Flex4DHuman]] — 首次提出该编码方案
- [[se3-relative-camera-encoding|SE(3) 相对相机编码]] — SE(3) 轴的具体实现
- [[rotary-position-embedding|RoPE]] — 基础旋转位置编码

View File

@@ -0,0 +1,47 @@
---
title: "固定均值高斯过程 (Fixed-Mean Gaussian Process)"
created: 2026-06-17
updated: 2026-06-17
type: concept
tags: [bayesian-deep-learning, uncertainty, gaussian-process, post-hoc]
sources: [raw/papers/ortega-phd-thesis-2026.md]
confidence: high
---
# 固定均值高斯过程 (Fixed-Mean Gaussian Process)
FMGP 是 [[ortega-phd-thesis|Ortega (2026)]] 提出的**轻量级后处理不确定性校准方法**——在冻结的预训练网络上附加 GP 协方差结构。
## 核心思想
将预训练网络视为 GP 的**固定均值函数**
```
f(x) ~ GP(μ_pretrained(x), k(x, x'))
```
- 均值 μ 由预训练网络提供(冻结,不再训练)
- 协方差 k 由 GP 核参数化(可学习)
## 优势
- **极简**:仅需学习核参数,预训练网络完全不动
- **校准**GP 提供原则性的预测不确定性
- **可扩展**:比完全 Bayesian 方法轻量得多
- **兼容性**:可在任意预训练网络上附加
## 与 VaLLA 的互补
| 方法 | 校准来源 | 训练 |
|------|---------|------|
| [[variational-linearized-laplace-approximation|VaLLA]] | 权重后验 | 变分学习 Σ |
| FMGP | GP 协方差 | 学习核参数 |
两者提供互补的不确定性量化策略。
## 参考
- [[variational-linearized-laplace-approximation|VaLLA]]
- [[bayesian-deep-learning|Bayesian 深度学习]]
- [[gaussian-process|高斯过程]]
- [[ortega-phd-thesis|论文]]

View File

@@ -0,0 +1,28 @@
---
title: "FlexAttention"
created: 2025-06-02
updated: 2025-06-02
type: concept
tags: [attention, pytorch, placeholder]
sources: []
---
# FlexAttention
> PyTorch 的可编程注意力 APIDong et al., 2024允许传入自定义注意力掩码区别于 FlashAttention-2 的固定掩码模式。
## 核心特性
- 支持自定义 attention maskBlockMask
- 编程模型:用 PyTorch 代码描述注意力模式,自动编译为高效 kernel
- 在 [[goru-one-pass-to-reason-2025|One-Pass to Reason]] 中被用作关键实现后端
## 与 FlashAttention 的关系
[[flash-attention|FlashAttention-2]] 速度快但不支持自定义掩码。FlexAttention 提供掩码灵活性,速度略慢(约 1520%),但在需要自定义注意力模式的场景(如 [[block-sparse-attention|分块稀疏注意力]])中是不可替代的。
## 相关
- [[flash-attention]]
- [[block-sparse-attention]]
- [[goru-one-pass-to-reason-2025|One-Pass to Reason]]

Some files were not shown because too many files have changed in this diff Show More