title, created, updated, type, tags, sources
| title |
created |
updated |
type |
tags |
sources |
| 提示词工程 vs 微调 |
2026-06-19 |
2026-06-19 |
concept |
| prompt-engineering |
| fine-tuning |
| llm |
| cost-optimization |
| dspy |
|
|
提示词工程 vs 微调
两种投资曲线
提示词工程和微调遵循截然不同的投资曲线——不是"哪个更好"的问题,而是"哪个在什么条件下更合适"。
|
提示词工程 |
微调 |
| 速度 |
快(小时到天) |
慢(数周) |
| 成本 |
低 |
高(GPT-4o 客户支持 ~$1 万 + 6 周) |
| 灵活性 |
高,易迭代 |
低,需重新训练 |
| 可靠性 |
脆弱(小输入变化 → 不一致输出) |
规模化可靠一致 |
| 缩放 |
好(< 10 万查询) |
更好(大批量,任务稳定时) |
关键发现
- DSPy 等提示优化工具在部分基准上超过微调 6-19 个百分点,需要的样本数少 35 倍(LLM Stats, 2026)
- 微调在任务稳定且定义明确时,高容量下回报最大
- 差距在逐年缩小——微调已演变为"提示已达上限后的最后一步"
实践框架
- 从提示词开始
- 遇到提示无法修复的故障时才升级到微调
- 低于 10 万查询,提示几乎总是正确的选择
混合模式
生产中越来越普遍:微调解决领域风格和基调 + RAG 作事实基础。两种技术解决不同的问题,互补而非互斥。
参考