Files
myWiki/concepts/prompt-engineering-vs-fine-tuning.md

1.6 KiB
Raw Blame History

title, created, updated, type, tags, sources
title created updated type tags sources
提示词工程 vs 微调 2026-06-19 2026-06-19 concept
prompt-engineering
fine-tuning
llm
cost-optimization
dspy
https://towardsdatascience.com/six-choices-every-ai-engineer-has-to-make-and-nobody-teaches/

提示词工程 vs 微调

两种投资曲线

提示词工程和微调遵循截然不同的投资曲线——不是"哪个更好"的问题,而是"哪个在什么条件下更合适"。

提示词工程 微调
速度 快(小时到天) 慢(数周)
成本 GPT-4o 客户支持 ~$1 万 + 6 周)
灵活性 高,易迭代 低,需重新训练
可靠性 脆弱(小输入变化 → 不一致输出) 规模化可靠一致
缩放 好(< 10 万查询) 更好(大批量,任务稳定时)

关键发现

  • DSPy 等提示优化工具在部分基准上超过微调 6-19 个百分点,需要的样本数少 35 倍LLM Stats, 2026
  • 微调在任务稳定且定义明确时,高容量下回报最大
  • 差距在逐年缩小——微调已演变为"提示已达上限后的最后一步"

实践框架

  1. 从提示词开始
  2. 遇到提示无法修复的故障时才升级到微调
  3. 低于 10 万查询,提示几乎总是正确的选择

混合模式

生产中越来越普遍:微调解决领域风格和基调 + RAG 作事实基础。两种技术解决不同的问题,互补而非互斥。

参考