myWiki/concepts/prompt-engineering-vs-fine-tuning.md

---
title: "提示词工程 vs 微调"
created: 2026-06-19
updated: 2026-06-19
type: concept
tags: [prompt-engineering, fine-tuning, llm, cost-optimization, dspy]
sources:
  - https://towardsdatascience.com/six-choices-every-ai-engineer-has-to-make-and-nobody-teaches/
---

# 提示词工程 vs 微调

## 两种投资曲线

提示词工程和微调遵循**截然不同的投资曲线**——不是"哪个更好"的问题，而是"哪个在什么条件下更合适"。

| | 提示词工程 | 微调 |
|---|---|---|
| **速度** | 快（小时到天） | 慢（数周） |
| **成本** | 低 | 高（GPT-4o 客户支持 ~$1 万 + 6 周） |
| **灵活性** | 高，易迭代 | 低，需重新训练 |
| **可靠性** | 脆弱（小输入变化 → 不一致输出） | 规模化可靠一致 |
| **缩放** | 好（< 10 万查询） | 更好（大批量，任务稳定时） |

## 关键发现

- DSPy 等提示优化工具在部分基准上**超过微调 6-19 个百分点**，需要的样本数少 35 倍（LLM Stats, 2026）
- 微调在任务**稳定且定义明确**时，高容量下回报最大
- 差距在逐年缩小——微调已演变为"提示已达上限后的最后一步"

## 实践框架

1. **从提示词开始**
2. **遇到提示无法修复的故障时才升级到微调**
3. **低于 10 万查询，提示几乎总是正确的选择**

## 混合模式

生产中越来越普遍：**微调解决领域风格和基调 + RAG 作事实基础**。两种技术解决不同的问题，互补而非互斥。

## 参考

- [[ai-production-tradeoffs|AI 生产权衡]]
- [[rag|RAG (检索增强生成)]]
- [[nobrega-ai-production-tradeoffs-2026|原文文章]]