SidneyZhang/myWiki

Files

Sidney Zhang 6021dea160

20260625:很多新内容

2026-06-25 14:08:47 +08:00

1.5 KiB

Raw Blame History

title, created, updated, type, tags, sources

title

created

updated

type

tags

sources

金融大模型选型

2026-06-24

2026-06-24

concept

model-selection

financial-llm

cost-efficiency

qwen

financial-llm-practice-2026

金融大模型选型

金融行业大模型选型中，模型能力与工程成本的权衡是核心决策。恒生电子的实践提供了一个有说服力的案例：小模型省下的算力钱远不够覆盖人力成本和隐性损失。

实践对比

维度	Qwen3-32B	Qwen3-235B
硬件投入	低	4×H800/H20，约 60 万一次性
规则数量	530 条	大幅削减
配套代码	4300 行	大幅削减
人力成本	6 个月，三人离职	显著降低
准确率	基准	+45pp

核心教训

小模型的隐性成本：为弥补能力不足，需要大量规则工程和代码补丁，导致团队消耗和人员流失
一次性硬件投入的杠杆效应：60 万一次性投入可大幅削减持续的人力成本
准确率提升是非线性的：+45pp 的提升意味着从"不可用"到"可生产"的质变

决策框架

选择模型规模时应考虑：

业务场景的容错率（金融近乎零容错）
规则工程的可持续性（每增加一条规则 = 维护负担）
团队稳定性（高规则复杂度 → 高离职风险）
Total Cost of Ownership（算力 + 人力 + 机会成本）

参考