myWiki/raw/articles/nobrega-ai-production-tradeoffs-2026.md

---
title: "Six Choices Every AI Engineer Has to Make (and Nobody Teaches)"
created: 2026-06-19
updated: 2026-06-19
type: article-raw
source: https://towardsdatascience.com/six-choices-every-ai-engineer-has-to-make-and-nobody-teaches/
wechat: https://mp.weixin.qq.com/s/GESoyR0qpxP4fPtHZjonKA
translator: 陈超
publisher: 数据派THU
---

# Six Choices Every AI Engineer Has to Make (and Nobody Teaches)

**作者**：Sara Nobrega
**翻译**：陈超（北京大学应用心理硕士）
**发布**：数据派THU（DatapiTHU）
**原文**：Towards Data Science

## 核心主题

AI 生产中 6 种关键权衡，都有最新研究支持。

## 6 种权衡

### 1. 构建 vs 购买（Build vs Buy）
- 三个选择：调用 API、微调开源模型、自建托管
- 日请求 < 10 万 → API（GPT-4o Mini）
- 日请求 > 100 万 → 自建（但注意：人力占成本的 70-80%，GPU 只占 20-30%）
- 团队平均超出 LLM 预算 340%，主因是缺少使用跟踪和成本归属

### 2. 模型复杂度 vs 可维护性
- CACE 原理：Change Anything Changes Everything (Sculley et al., 2015)
- 数据依赖比代码依赖更昂贵
- 为 2% 精度提升选择更复杂模型 → 支付 18 个月调试税

### 3. 数据数量 vs 数据质量
- 超过噪声阈值，更多低质量数据会降低性能
- "数据沼泽"问题：存储便宜 → 什么都存 → 清理成本爆炸
- 医疗 AI：专家标注小数据集 > 不可靠标注大数据集

### 4. 吞吐量 vs 延迟（批处理 vs 实时）
- 批处理：按时生成预测，低成本，简单，预测可能过时
- 实时：按需，毫秒级，昂贵，24/7 运维
- 大多数业务问题不需要亚秒级预测

### 5. 提示词工程 vs 微调
- 提示词工程：快、便宜、灵活，但脆弱
- 微调：昂贵（GPT-4o 客户支持约 $1万 + 6 周），但规模化可靠
- DSPy 提示优化在部分基准上超微调 6-19 个百分点
- 混合模式兴起：微调解决风格/基调 + RAG 作事实基础

### 6. 自动化 vs 人类监督（HITL）
- 完全人工审查无法规模化
- 选择性 HITL：只在边缘案例、低置信度、高风险决策时触发人工
- AI 处理规模/速度/模式识别，人类处理不可逆性
- 医疗/金融/法律领域，HITL 通常是合规要求

## 核心原则

> 在生产中，决策的成本很少在决策做出的地方产生回报。

复杂度的代价延迟偿付——更复杂的模型在 6 个月后增加维护成本，实时系统的 24/7 基础设施支撑长期代价更高，大规模脏数据在重训练周期上付出代价。