Files
myWiki/raw/articles/qifu-llm-finance-practice-2026.md

40 lines
1.6 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

---
source_url: https://mp.weixin.qq.com/s/UnA-OLSc0mVqe7KyBX7yJw
ingested: 2026-06-14
sha256: skip
---
# 金融行业大模型落地实践:从知识工程到后训练部署
**分享嘉宾:** 王元,奇富科技 DeepBank 算法组负责人
**活动:** 2026 DA 上海站
**出品社区:** DataFun
**校对:** 韩珊珊
## 全文摘要
金融行业是大模型落地的"深水区":业务逻辑复杂、数据合规严格、算力预算有限。通用大模型进入银行或金融科技公司的生产环境,面临无标注数据、无操作手册、无充裕 GPU、甚至"标准答案"缺失的窘境。
## 核心内容
### 冰山难题
- 零数据困境:输入 X 和标签 Y 都不存在,监督微调无法启动
- 评估盲区:生成式输出缺乏标准答案,难以客观量化评估
- 算力与合规壁垒:必须本地化部署,受限硬件预算
### 数据与知识工程
- 基于 REER 算法的逆向知识提炼:从 QA 对中反向提取业务手册的四步流程
- 多维合成数据策略:客户/场景/录制人三维度构建训练数据多样性
- LLM Wiki 方法:参考 Anthropic Captain 的 Markdown+Git 知识库方案
### 后训练与部署
- APO 自动提示工程:作为高质量 Base Prompt 的基线生成器
- 后训练成本博弈SFT < 后置推理 RL < 前置推理 RL
- MOE 模型 + LoRA 工具链冲突VeRL 不支持
- AI Agent 辅助模型训练自动化
- 推理加速MOE 架构 + Int8 量化 + vLLM
### 情绪价值评估
- "先看着对后用着有效果"心理学方法构建评估器
- 在商业签单阶段优先提供情绪价值再追求硬指标