--- title: "提示词工程 vs 微调" created: 2026-06-19 updated: 2026-06-19 type: concept tags: [prompt-engineering, fine-tuning, llm, cost-optimization, dspy] sources: - https://towardsdatascience.com/six-choices-every-ai-engineer-has-to-make-and-nobody-teaches/ --- # 提示词工程 vs 微调 ## 两种投资曲线 提示词工程和微调遵循**截然不同的投资曲线**——不是"哪个更好"的问题,而是"哪个在什么条件下更合适"。 | | 提示词工程 | 微调 | |---|---|---| | **速度** | 快(小时到天) | 慢(数周) | | **成本** | 低 | 高(GPT-4o 客户支持 ~$1 万 + 6 周) | | **灵活性** | 高,易迭代 | 低,需重新训练 | | **可靠性** | 脆弱(小输入变化 → 不一致输出) | 规模化可靠一致 | | **缩放** | 好(< 10 万查询) | 更好(大批量,任务稳定时) | ## 关键发现 - DSPy 等提示优化工具在部分基准上**超过微调 6-19 个百分点**,需要的样本数少 35 倍(LLM Stats, 2026) - 微调在任务**稳定且定义明确**时,高容量下回报最大 - 差距在逐年缩小——微调已演变为"提示已达上限后的最后一步" ## 实践框架 1. **从提示词开始** 2. **遇到提示无法修复的故障时才升级到微调** 3. **低于 10 万查询,提示几乎总是正确的选择** ## 混合模式 生产中越来越普遍:**微调解决领域风格和基调 + RAG 作事实基础**。两种技术解决不同的问题,互补而非互斥。 ## 参考 - [[ai-production-tradeoffs|AI 生产权衡]] - [[rag|RAG (检索增强生成)]] - [[nobrega-ai-production-tradeoffs-2026|原文文章]]