20260601

2026-06-01 10:46:01 +08:00
parent 2faf4bb002
commit e96b955fda
221 changed files with 10219 additions and 332 deletions
--- a/concepts/compiled-ai-paradigm.md
+++ b/concepts/compiled-ai-paradigm.md
@@ -0,0 +1,51 @@
+---
+title: "Compiled AI Paradigm (编译型 AI 范式)"
+created: 2026-05-29
+updated: 2026-05-29
+type: concept
+tags: ["ai-paradigm", "compilation", "code-synthesis", "deployment"]
+sources: ["https://mp.weixin.qq.com/s/PglkqhlSoI7LEOb3AOHl8g"]
+---
+
+# Compiled AI Paradigm (编译型 AI 范式)
+
+**Compiled AI Paradigm** 是一种新兴的 AI 部署范式：LLM 在**编译阶段**生成可执行代码，**执行阶段**确定性运行——完全不调用 LLM。[[autoharness|AutoHarness]] 的 Harness-as-Policy 模式是其典型实例。
+
+## 与传统 AI 部署的对比
+
+| 阶段 | 传统部署 | 编译型 AI |
+|------|----------|-----------|
+| 训练 | Fine-tuning / RLHF | 代码搜索 + 迭代精炼 |
+| 编译 | 模型量化/导出 | LLM 生成 + 环境验证 |
+| 推理 | GPU 上的矩阵乘法 | CPU 上的 Python/编译代码 |
+| 成本 | 高昂（GPU 算力） | 趋近于零 |
+| 可解释性 | 无 | 完整源码审计 |
+
+## 核心思想
+
+LLM 的"智能"被**蒸馏编译**为可执行程序：
+- 训练阶段：LLM 通过环境反馈学习策略
+- 编译阶段：策略被抽象为确定性代码
+- 推理阶段：代码直接运行，无需 LLM
+
+## 实例
+
+- **Harness-as-Policy**：Gemini-2.5-Flash 训练 → Python 代码策略 → 16 个游戏平均 reward 0.870
+- **成本对比**：编译型 ~$0 vs GPT-5.2 ~$640
+
+## 适用条件
+
+- 任务规则可形式化（如棋盘游戏）
+- 策略空间可被代码穷举或近似
+- 环境反馈明确（合法/非法、reward）
+
+## 局限
+
+- 复杂博弈推理（2P 游戏）需要 MCTS 等搜索算法
+- 模糊约束环境（物理交互、社会规范）难以形式化
+
+## 相关
+
+- [[harness-as-policy]] — 编译型 AI 的典型实现
+- [[heuristic-learning]] — 编译型 AI 的学习范式基础
+- [[harness-engineering]] — 编译型 AI 的工程支撑