Files
myWiki/concepts/financial-llm-model-selection.md

43 lines
1.5 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

---
title: "金融大模型选型"
created: 2026-06-24
updated: 2026-06-24
type: concept
tags: ["model-selection", "financial-llm", "cost-efficiency", "qwen"]
sources:
- "[[financial-llm-practice-2026]]"
---
# 金融大模型选型
金融行业大模型选型中,模型能力与工程成本的权衡是核心决策。恒生电子的实践提供了一个有说服力的案例:小模型省下的算力钱远不够覆盖人力成本和隐性损失。
## 实践对比
| 维度 | Qwen3-32B | Qwen3-235B |
|------|-----------|------------|
| 硬件投入 | 低 | 4×H800/H20约 60 万一次性 |
| 规则数量 | 530 条 | 大幅削减 |
| 配套代码 | 4300 行 | 大幅削减 |
| 人力成本 | 6 个月,三人离职 | 显著降低 |
| 准确率 | 基准 | +45pp |
## 核心教训
1. **小模型的隐性成本**:为弥补能力不足,需要大量规则工程和代码补丁,导致团队消耗和人员流失
2. **一次性硬件投入的杠杆效应**60 万一次性投入可大幅削减持续的人力成本
3. **准确率提升是非线性的**+45pp 的提升意味着从"不可用"到"可生产"的质变
## 决策框架
选择模型规模时应考虑:
- 业务场景的容错率(金融近乎零容错)
- 规则工程的可持续性(每增加一条规则 = 维护负担)
- 团队稳定性(高规则复杂度 → 高离职风险)
- Total Cost of Ownership算力 + 人力 + 机会成本)
## 参考
- [[financial-llm-practice-2026|金融行业大模型落地实践]]
- [[financial-llm-requirements]]
- [[context-engineering]]