20260625:很多新内容

2026-06-25 14:08:47 +08:00
parent 91fac5b6fc
commit 6021dea160
375 changed files with 19263 additions and 251 deletions
--- a/concepts/financial-llm-model-selection.md
+++ b/concepts/financial-llm-model-selection.md
@@ -0,0 +1,42 @@
+---
+title: "金融大模型选型"
+created: 2026-06-24
+updated: 2026-06-24
+type: concept
+tags: ["model-selection", "financial-llm", "cost-efficiency", "qwen"]
+sources:
+  - "[[financial-llm-practice-2026]]"
+---
+
+# 金融大模型选型
+
+金融行业大模型选型中，模型能力与工程成本的权衡是核心决策。恒生电子的实践提供了一个有说服力的案例：小模型省下的算力钱远不够覆盖人力成本和隐性损失。
+
+## 实践对比
+
+| 维度 | Qwen3-32B | Qwen3-235B |
+|------|-----------|------------|
+| 硬件投入 | 低 | 4×H800/H20，约 60 万一次性 |
+| 规则数量 | 530 条 | 大幅削减 |
+| 配套代码 | 4300 行 | 大幅削减 |
+| 人力成本 | 6 个月，三人离职 | 显著降低 |
+| 准确率 | 基准 | +45pp |
+
+## 核心教训
+
+1. **小模型的隐性成本**：为弥补能力不足，需要大量规则工程和代码补丁，导致团队消耗和人员流失
+2. **一次性硬件投入的杠杆效应**：60 万一次性投入可大幅削减持续的人力成本
+3. **准确率提升是非线性的**：+45pp 的提升意味着从"不可用"到"可生产"的质变
+
+## 决策框架
+
+选择模型规模时应考虑：
+- 业务场景的容错率（金融近乎零容错）
+- 规则工程的可持续性（每增加一条规则 = 维护负担）
+- 团队稳定性（高规则复杂度 → 高离职风险）
+- Total Cost of Ownership（算力 + 人力 + 机会成本）
+
+## 参考
+- [[financial-llm-practice-2026|金融行业大模型落地实践]]
+- [[financial-llm-requirements]]
+- [[context-engineering]]