myWiki/concepts/ai-production-tradeoffs.md

---
title: "AI 生产权衡 — 六大维度"
created: 2026-06-19
updated: 2026-06-19
type: concept
tags: [ai-engineering, production, tradeoffs, mlops]
sources:
  - https://towardsdatascience.com/six-choices-every-ai-engineer-has-to-make-and-nobody-teaches/
---

# AI 生产权衡

## 定义

AI 工程师在生产部署中面临的关键决策维度。来自 Sara Nobrega (2026) 的框架：这些权衡没有"正确"答案，但有可操作的框架、真实数字和决策背景。

## 六大维度

| # | 权衡 | 核心问题 |
|---|------|---------|
| 1 | [[build-vs-buy-llm|构建 vs 购买]] | API 调用何时不再划算？ |
| 2 | [[cace-principle|复杂度 vs 可维护性]] | 6 个月后谁来调试？ |
| 3 | [[data-quality-vs-quantity|数据数量 vs 质量]] | 更多数据何时变成更差结果？ |
| 4 | [[batch-vs-real-time-inference|吞吐量 vs 延迟]] | 批处理还是实时？ |
| 5 | [[prompt-engineering-vs-fine-tuning|提示词 vs 微调]] | 两条截然不同的投资曲线 |
| 6 | [[human-in-the-loop|自动化 vs 人类监督]] | 你有多信任模型独立行动？ |

## 统一原则

> **决策的成本很少在决策做出的地方产生回报。** 复杂度的代价延迟偿付——更复杂的模型 6 个月后增加维护成本，实时系统的 24/7 支撑长期代价更高，大规模脏数据在重训练周期上付出代价。

## 常见模式

- 团队默认使用实时推理（因为"听起来更令人印象深刻"），但大多数业务问题不需要亚秒级预测
- 团队平均超出 LLM 预算 340%，主因是缺少使用跟踪和成本归属
- 为 2% 精度提升选复杂模型，为这个选择支付 18 个月的调试税

## 参考

- [[nobrega-ai-production-tradeoffs-2026|原文文章]]
- [[ml-technical-debt|ML 技术债务]]
- [[selective-hitl|选择性 HITL]]