title, created, updated, type, tags, sources
| title |
created |
updated |
type |
tags |
sources |
| AI 生产权衡 — 六大维度 |
2026-06-19 |
2026-06-19 |
concept |
| ai-engineering |
| production |
| tradeoffs |
| mlops |
|
|
AI 生产权衡
定义
AI 工程师在生产部署中面临的关键决策维度。来自 Sara Nobrega (2026) 的框架:这些权衡没有"正确"答案,但有可操作的框架、真实数字和决策背景。
六大维度
| # |
权衡 |
核心问题 |
| 1 |
[[build-vs-buy-llm |
构建 vs 购买]] |
| 2 |
[[cace-principle |
复杂度 vs 可维护性]] |
| 3 |
[[data-quality-vs-quantity |
数据数量 vs 质量]] |
| 4 |
[[batch-vs-real-time-inference |
吞吐量 vs 延迟]] |
| 5 |
[[prompt-engineering-vs-fine-tuning |
提示词 vs 微调]] |
| 6 |
[[human-in-the-loop |
自动化 vs 人类监督]] |
统一原则
决策的成本很少在决策做出的地方产生回报。 复杂度的代价延迟偿付——更复杂的模型 6 个月后增加维护成本,实时系统的 24/7 支撑长期代价更高,大规模脏数据在重训练周期上付出代价。
常见模式
- 团队默认使用实时推理(因为"听起来更令人印象深刻"),但大多数业务问题不需要亚秒级预测
- 团队平均超出 LLM 预算 340%,主因是缺少使用跟踪和成本归属
- 为 2% 精度提升选复杂模型,为这个选择支付 18 个月的调试税
参考