SidneyZhang/myWiki

Files

Sidney Zhang e96b955fda

20260601

2026-06-01 10:46:01 +08:00

1.8 KiB

Raw Blame History

title, created, updated, type, tags, sources

title

created

updated

type

tags

sources

Compiled AI Paradigm (编译型 AI 范式)

2026-05-29

2026-05-29

concept

ai-paradigm

compilation

code-synthesis

deployment

https://mp.weixin.qq.com/s/PglkqhlSoI7LEOb3AOHl8g

Compiled AI Paradigm (编译型 AI 范式)

Compiled AI Paradigm 是一种新兴的 AI 部署范式：LLM 在编译阶段生成可执行代码，执行阶段确定性运行——完全不调用 LLM。autoharness 的 Harness-as-Policy 模式是其典型实例。

与传统 AI 部署的对比

阶段	传统部署	编译型 AI
训练	Fine-tuning / RLHF	代码搜索 + 迭代精炼
编译	模型量化/导出	LLM 生成 + 环境验证
推理	GPU 上的矩阵乘法	CPU 上的 Python/编译代码
成本	高昂（GPU 算力）	趋近于零
可解释性	无	完整源码审计

核心思想

LLM 的"智能"被蒸馏编译为可执行程序：

训练阶段：LLM 通过环境反馈学习策略
编译阶段：策略被抽象为确定性代码
推理阶段：代码直接运行，无需 LLM

实例

Harness-as-Policy：Gemini-2.5-Flash 训练 → Python 代码策略 → 16 个游戏平均 reward 0.870
成本对比：编译型 ~$0 vs GPT-5.2 ~$640

适用条件

任务规则可形式化（如棋盘游戏）
策略空间可被代码穷举或近似
环境反馈明确（合法/非法、reward）

局限

复杂博弈推理（2P 游戏）需要 MCTS 等搜索算法
模糊约束环境（物理交互、社会规范）难以形式化

相关

harness-as-policy — 编译型 AI 的典型实现
heuristic-learning — 编译型 AI 的学习范式基础
harness-engineering — 编译型 AI 的工程支撑