20260617:目前有914 页

2026-06-17 15:02:40 +08:00
parent e96b955fda
commit 91fac5b6fc
423 changed files with 20687 additions and 34 deletions
--- a/raw/articles/qifu-llm-finance-practice-2026.md
+++ b/raw/articles/qifu-llm-finance-practice-2026.md
@@ -0,0 +1,39 @@
+---
+source_url: https://mp.weixin.qq.com/s/UnA-OLSc0mVqe7KyBX7yJw
+ingested: 2026-06-14
+sha256: skip
+---
+
+# 金融行业大模型落地实践：从知识工程到后训练部署
+
+**分享嘉宾:** 王元，奇富科技 DeepBank 算法组负责人
+**活动:** 2026 DA 上海站
+**出品社区:** DataFun
+**校对:** 韩珊珊
+
+## 全文摘要
+
+金融行业是大模型落地的"深水区"：业务逻辑复杂、数据合规严格、算力预算有限。通用大模型进入银行或金融科技公司的生产环境，面临无标注数据、无操作手册、无充裕 GPU、甚至"标准答案"缺失的窘境。
+
+## 核心内容
+
+### 冰山难题
+- 零数据困境：输入 X 和标签 Y 都不存在，监督微调无法启动
+- 评估盲区：生成式输出缺乏标准答案，难以客观量化评估
+- 算力与合规壁垒：必须本地化部署，受限硬件预算
+
+### 数据与知识工程
+- 基于 REER 算法的逆向知识提炼：从 QA 对中反向提取业务手册的四步流程
+- 多维合成数据策略：客户/场景/录制人三维度构建训练数据多样性
+- LLM Wiki 方法：参考 Anthropic Captain 的 Markdown+Git 知识库方案
+
+### 后训练与部署
+- APO 自动提示工程：作为高质量 Base Prompt 的基线生成器
+- 后训练成本博弈：SFT < 后置推理 RL < 前置推理 RL
+- MOE 模型 + LoRA 工具链冲突（VeRL 不支持）
+- AI Agent 辅助模型训练自动化
+- 推理加速：MOE 架构 + Int8 量化 + vLLM
+
+### 情绪价值评估
+- "先看着对，后用着有效果"：心理学方法构建评估器
+- 在商业签单阶段优先提供情绪价值，再追求硬指标