title, created, updated, type, tags, sources
| title |
created |
updated |
type |
tags |
sources |
| Compiled AI Paradigm (编译型 AI 范式) |
2026-05-29 |
2026-05-29 |
concept |
| ai-paradigm |
| compilation |
| code-synthesis |
| deployment |
|
|
Compiled AI Paradigm (编译型 AI 范式)
Compiled AI Paradigm 是一种新兴的 AI 部署范式:LLM 在编译阶段生成可执行代码,执行阶段确定性运行——完全不调用 LLM。autoharness 的 Harness-as-Policy 模式是其典型实例。
与传统 AI 部署的对比
| 阶段 |
传统部署 |
编译型 AI |
| 训练 |
Fine-tuning / RLHF |
代码搜索 + 迭代精炼 |
| 编译 |
模型量化/导出 |
LLM 生成 + 环境验证 |
| 推理 |
GPU 上的矩阵乘法 |
CPU 上的 Python/编译代码 |
| 成本 |
高昂(GPU 算力) |
趋近于零 |
| 可解释性 |
无 |
完整源码审计 |
核心思想
LLM 的"智能"被蒸馏编译为可执行程序:
- 训练阶段:LLM 通过环境反馈学习策略
- 编译阶段:策略被抽象为确定性代码
- 推理阶段:代码直接运行,无需 LLM
实例
- Harness-as-Policy:Gemini-2.5-Flash 训练 → Python 代码策略 → 16 个游戏平均 reward 0.870
- 成本对比:编译型 ~$0 vs GPT-5.2 ~$640
适用条件
- 任务规则可形式化(如棋盘游戏)
- 策略空间可被代码穷举或近似
- 环境反馈明确(合法/非法、reward)
局限
- 复杂博弈推理(2P 游戏)需要 MCTS 等搜索算法
- 模糊约束环境(物理交互、社会规范)难以形式化
相关