40 lines
1.6 KiB
Markdown
40 lines
1.6 KiB
Markdown
---
|
||
source_url: https://mp.weixin.qq.com/s/UnA-OLSc0mVqe7KyBX7yJw
|
||
ingested: 2026-06-14
|
||
sha256: skip
|
||
---
|
||
|
||
# 金融行业大模型落地实践:从知识工程到后训练部署
|
||
|
||
**分享嘉宾:** 王元,奇富科技 DeepBank 算法组负责人
|
||
**活动:** 2026 DA 上海站
|
||
**出品社区:** DataFun
|
||
**校对:** 韩珊珊
|
||
|
||
## 全文摘要
|
||
|
||
金融行业是大模型落地的"深水区":业务逻辑复杂、数据合规严格、算力预算有限。通用大模型进入银行或金融科技公司的生产环境,面临无标注数据、无操作手册、无充裕 GPU、甚至"标准答案"缺失的窘境。
|
||
|
||
## 核心内容
|
||
|
||
### 冰山难题
|
||
- 零数据困境:输入 X 和标签 Y 都不存在,监督微调无法启动
|
||
- 评估盲区:生成式输出缺乏标准答案,难以客观量化评估
|
||
- 算力与合规壁垒:必须本地化部署,受限硬件预算
|
||
|
||
### 数据与知识工程
|
||
- 基于 REER 算法的逆向知识提炼:从 QA 对中反向提取业务手册的四步流程
|
||
- 多维合成数据策略:客户/场景/录制人三维度构建训练数据多样性
|
||
- LLM Wiki 方法:参考 Anthropic Captain 的 Markdown+Git 知识库方案
|
||
|
||
### 后训练与部署
|
||
- APO 自动提示工程:作为高质量 Base Prompt 的基线生成器
|
||
- 后训练成本博弈:SFT < 后置推理 RL < 前置推理 RL
|
||
- MOE 模型 + LoRA 工具链冲突(VeRL 不支持)
|
||
- AI Agent 辅助模型训练自动化
|
||
- 推理加速:MOE 架构 + Int8 量化 + vLLM
|
||
|
||
### 情绪价值评估
|
||
- "先看着对,后用着有效果":心理学方法构建评估器
|
||
- 在商业签单阶段优先提供情绪价值,再追求硬指标
|