title, created, updated, type, tags, sources
| title |
created |
updated |
type |
tags |
sources |
| 金融大模型选型 |
2026-06-24 |
2026-06-24 |
concept |
| model-selection |
| financial-llm |
| cost-efficiency |
| qwen |
|
|
金融大模型选型
金融行业大模型选型中,模型能力与工程成本的权衡是核心决策。恒生电子的实践提供了一个有说服力的案例:小模型省下的算力钱远不够覆盖人力成本和隐性损失。
实践对比
| 维度 |
Qwen3-32B |
Qwen3-235B |
| 硬件投入 |
低 |
4×H800/H20,约 60 万一次性 |
| 规则数量 |
530 条 |
大幅削减 |
| 配套代码 |
4300 行 |
大幅削减 |
| 人力成本 |
6 个月,三人离职 |
显著降低 |
| 准确率 |
基准 |
+45pp |
核心教训
- 小模型的隐性成本:为弥补能力不足,需要大量规则工程和代码补丁,导致团队消耗和人员流失
- 一次性硬件投入的杠杆效应:60 万一次性投入可大幅削减持续的人力成本
- 准确率提升是非线性的:+45pp 的提升意味着从"不可用"到"可生产"的质变
决策框架
选择模型规模时应考虑:
- 业务场景的容错率(金融近乎零容错)
- 规则工程的可持续性(每增加一条规则 = 维护负担)
- 团队稳定性(高规则复杂度 → 高离职风险)
- Total Cost of Ownership(算力 + 人力 + 机会成本)
参考