41 lines
1.4 KiB
Markdown
41 lines
1.4 KiB
Markdown
---
|
||
title: "构建 vs 购买 — Build vs Buy (LLM)"
|
||
created: 2026-06-19
|
||
updated: 2026-06-19
|
||
type: concept
|
||
tags: [llm, cost-optimization, infrastructure, api-vs-self-host]
|
||
sources:
|
||
- https://towardsdatascience.com/six-choices-every-ai-engineer-has-to-make-and-nobody-teaches/
|
||
---
|
||
|
||
# 构建 vs 购买(Build vs Buy)
|
||
|
||
## 定义
|
||
|
||
在 LLM 时代,"构建 vs 购买"不再是从零训练模型的问题。2026 年的版本更难:三个选择,每个有不同的成本曲线和失效模式。
|
||
|
||
## 三个选择
|
||
|
||
| 选择 | 适用场景 | 成本结构 | 失效模式 |
|
||
|------|---------|---------|---------|
|
||
| **调用 API** | 日请求 < 10 万 | 按 token 付费,低开销 | 供应商锁定、框架迁移 |
|
||
| **微调开源模型** | 中等规模,专业化需求 | 一次性计算成本 | 数据准备和评估成本 |
|
||
| **自建托管** | 日请求 > 100 万 | 硬件 + 人力 | 人力占 70-80% 成本! |
|
||
|
||
## 关键数据
|
||
|
||
- Omdia 调查(n=376):95% 认为自建提供更多定制,91% 同意预构建更快——**两者同时成立**
|
||
- 硬件和电力仅占自托管成本的 20-30%,**人力占 70-80%**
|
||
- 团队平均超出 LLM 预算 340%,主因是缺少使用跟踪和成本归属
|
||
|
||
## 实践框架
|
||
|
||
1. **从 API 开始**
|
||
2. **从第一天起记录每次调用的成本、延迟和功能归属**
|
||
3. **当运算显示优势下降时再更换**
|
||
|
||
## 参考
|
||
|
||
- [[ai-production-tradeoffs|AI 生产权衡]]
|
||
- [[nobrega-ai-production-tradeoffs-2026|原文文章]]
|