43 lines
1.8 KiB
Markdown
43 lines
1.8 KiB
Markdown
---
|
|
title: "AI 生产权衡 — 六大维度"
|
|
created: 2026-06-19
|
|
updated: 2026-06-19
|
|
type: concept
|
|
tags: [ai-engineering, production, tradeoffs, mlops]
|
|
sources:
|
|
- https://towardsdatascience.com/six-choices-every-ai-engineer-has-to-make-and-nobody-teaches/
|
|
---
|
|
|
|
# AI 生产权衡
|
|
|
|
## 定义
|
|
|
|
AI 工程师在生产部署中面临的关键决策维度。来自 Sara Nobrega (2026) 的框架:这些权衡没有"正确"答案,但有可操作的框架、真实数字和决策背景。
|
|
|
|
## 六大维度
|
|
|
|
| # | 权衡 | 核心问题 |
|
|
|---|------|---------|
|
|
| 1 | [[build-vs-buy-llm|构建 vs 购买]] | API 调用何时不再划算? |
|
|
| 2 | [[cace-principle|复杂度 vs 可维护性]] | 6 个月后谁来调试? |
|
|
| 3 | [[data-quality-vs-quantity|数据数量 vs 质量]] | 更多数据何时变成更差结果? |
|
|
| 4 | [[batch-vs-real-time-inference|吞吐量 vs 延迟]] | 批处理还是实时? |
|
|
| 5 | [[prompt-engineering-vs-fine-tuning|提示词 vs 微调]] | 两条截然不同的投资曲线 |
|
|
| 6 | [[human-in-the-loop|自动化 vs 人类监督]] | 你有多信任模型独立行动? |
|
|
|
|
## 统一原则
|
|
|
|
> **决策的成本很少在决策做出的地方产生回报。** 复杂度的代价延迟偿付——更复杂的模型 6 个月后增加维护成本,实时系统的 24/7 支撑长期代价更高,大规模脏数据在重训练周期上付出代价。
|
|
|
|
## 常见模式
|
|
|
|
- 团队默认使用实时推理(因为"听起来更令人印象深刻"),但大多数业务问题不需要亚秒级预测
|
|
- 团队平均超出 LLM 预算 340%,主因是缺少使用跟踪和成本归属
|
|
- 为 2% 精度提升选复杂模型,为这个选择支付 18 个月的调试税
|
|
|
|
## 参考
|
|
|
|
- [[nobrega-ai-production-tradeoffs-2026|原文文章]]
|
|
- [[ml-technical-debt|ML 技术债务]]
|
|
- [[selective-hitl|选择性 HITL]]
|