20260625:很多新内容

This commit is contained in:
2026-06-25 14:08:47 +08:00
parent 91fac5b6fc
commit 6021dea160
375 changed files with 19263 additions and 251 deletions

View File

@@ -0,0 +1,42 @@
---
title: "AI 生产权衡 — 六大维度"
created: 2026-06-19
updated: 2026-06-19
type: concept
tags: [ai-engineering, production, tradeoffs, mlops]
sources:
- https://towardsdatascience.com/six-choices-every-ai-engineer-has-to-make-and-nobody-teaches/
---
# AI 生产权衡
## 定义
AI 工程师在生产部署中面临的关键决策维度。来自 Sara Nobrega (2026) 的框架:这些权衡没有"正确"答案,但有可操作的框架、真实数字和决策背景。
## 六大维度
| # | 权衡 | 核心问题 |
|---|------|---------|
| 1 | [[build-vs-buy-llm|构建 vs 购买]] | API 调用何时不再划算? |
| 2 | [[cace-principle|复杂度 vs 可维护性]] | 6 个月后谁来调试? |
| 3 | [[data-quality-vs-quantity|数据数量 vs 质量]] | 更多数据何时变成更差结果? |
| 4 | [[batch-vs-real-time-inference|吞吐量 vs 延迟]] | 批处理还是实时? |
| 5 | [[prompt-engineering-vs-fine-tuning|提示词 vs 微调]] | 两条截然不同的投资曲线 |
| 6 | [[human-in-the-loop|自动化 vs 人类监督]] | 你有多信任模型独立行动? |
## 统一原则
> **决策的成本很少在决策做出的地方产生回报。** 复杂度的代价延迟偿付——更复杂的模型 6 个月后增加维护成本,实时系统的 24/7 支撑长期代价更高,大规模脏数据在重训练周期上付出代价。
## 常见模式
- 团队默认使用实时推理(因为"听起来更令人印象深刻"),但大多数业务问题不需要亚秒级预测
- 团队平均超出 LLM 预算 340%,主因是缺少使用跟踪和成本归属
- 为 2% 精度提升选复杂模型,为这个选择支付 18 个月的调试税
## 参考
- [[nobrega-ai-production-tradeoffs-2026|原文文章]]
- [[ml-technical-debt|ML 技术债务]]
- [[selective-hitl|选择性 HITL]]