43 lines
1.5 KiB
Markdown
43 lines
1.5 KiB
Markdown
---
|
||
title: "金融大模型选型"
|
||
created: 2026-06-24
|
||
updated: 2026-06-24
|
||
type: concept
|
||
tags: ["model-selection", "financial-llm", "cost-efficiency", "qwen"]
|
||
sources:
|
||
- "[[financial-llm-practice-2026]]"
|
||
---
|
||
|
||
# 金融大模型选型
|
||
|
||
金融行业大模型选型中,模型能力与工程成本的权衡是核心决策。恒生电子的实践提供了一个有说服力的案例:小模型省下的算力钱远不够覆盖人力成本和隐性损失。
|
||
|
||
## 实践对比
|
||
|
||
| 维度 | Qwen3-32B | Qwen3-235B |
|
||
|------|-----------|------------|
|
||
| 硬件投入 | 低 | 4×H800/H20,约 60 万一次性 |
|
||
| 规则数量 | 530 条 | 大幅削减 |
|
||
| 配套代码 | 4300 行 | 大幅削减 |
|
||
| 人力成本 | 6 个月,三人离职 | 显著降低 |
|
||
| 准确率 | 基准 | +45pp |
|
||
|
||
## 核心教训
|
||
|
||
1. **小模型的隐性成本**:为弥补能力不足,需要大量规则工程和代码补丁,导致团队消耗和人员流失
|
||
2. **一次性硬件投入的杠杆效应**:60 万一次性投入可大幅削减持续的人力成本
|
||
3. **准确率提升是非线性的**:+45pp 的提升意味着从"不可用"到"可生产"的质变
|
||
|
||
## 决策框架
|
||
|
||
选择模型规模时应考虑:
|
||
- 业务场景的容错率(金融近乎零容错)
|
||
- 规则工程的可持续性(每增加一条规则 = 维护负担)
|
||
- 团队稳定性(高规则复杂度 → 高离职风险)
|
||
- Total Cost of Ownership(算力 + 人力 + 机会成本)
|
||
|
||
## 参考
|
||
- [[financial-llm-practice-2026|金融行业大模型落地实践]]
|
||
- [[financial-llm-requirements]]
|
||
- [[context-engineering]]
|