20260625:很多新内容

2026-06-25 14:08:47 +08:00
parent 91fac5b6fc
commit 6021dea160
375 changed files with 19263 additions and 251 deletions
--- a/raw/articles/financial-llm-practice-2026.md
+++ b/raw/articles/financial-llm-practice-2026.md
@@ -0,0 +1,49 @@
+---
+title: "金融行业大模型落地实践：从长文档检索到 Agent 工程"
+author: "林金曙（恒生电子研究院 AI 首席技术专家）"
+source: "DataFun / DAcon 上海站 2026"
+date: "2026"
+type: "article"
+tags: ["financial-llm", "agent", "rag", "pageindex", "mcp", "context-engineering"]
+---
+
+# 金融行业大模型落地实践：从长文档检索到 Agent 工程
+
+> 林金曙，恒生电子研究院 AI 首席技术专家，DAcon 上海站 2026
+> 编辑整理：韩珊珊 | 出品社区：DataFun
+
+## 摘要
+
+系统梳理了金融行业落地大模型的三重挑战（合规刚性、数据安全、业务严谨性），基于恒生电子在券商、基金、银行等机构的实际项目经验，重点分享了 PageIndex 长文档检索方案、Agentic RAG 架构、金融场景"好需求"定义方法、大模型选型教训（Qwen3-32B vs Qwen3-235B）、上下文工程实践，以及 Agent 从工具调用到自主规划的探索。
+
+## 核心内容
+
+### 1. 金融行业的三重约束
+- **合规**：每段生成内容可溯源、结果需人工确认
+- **安全**：私有化部署、数据不出域
+- **严谨**：私域数据与业务系统无缝挂接，数据质量优先于模型能力
+
+### 2. 场景案例
+- **机构运营**：200+ 件材料办理流程 → 自然语言意图转译为系统操作序列
+- **投顾理财**：保险条款合规判断（RAG 只解决"看懂"，业务闭环需调用系统接口）
+- **托管运营**：信披报告自动审核（净值、勾稽关系等规则自动化）
+- **投行**：蜜雪冰城 1300 页招股书 → PageIndex 方案
+
+### 3. 核心工程实践
+- **PageIndex**：利用文档目录结构建立"章节名↔页码范围"映射，将检索从 300 页压缩到 3 页
+- **Agentic RAG**：任务拆解为子问题，动态调用 PageIndex/BM25/向量检索，自我评估信息充分性
+- **无向量检索**：金融查询大量精确匹配（代码、专有名词、数字），BM25 优于向量检索
+- **好需求三要素**：在哪里看（限定章节）、看什么（业务语言）、怎么判（SOP 可执行条件）
+- **选型教训**：Qwen3-32B → 530 条规则/4300 行代码/三人离职；Qwen3-235B → 规则砍半，准确率 +45pp
+- **上下文工程**：prompt 从 24K token 压缩到 3K，180 个财务指标按需拼入
+
+### 4. Agent 探索
+- OpenClaw 在金融场景的四短板：权限模糊、审计不足、插件无管控、幻觉无兜底
+- Skill 原子化 + MCP 协议接入
+- 接口大模型友好改造（业务语义、时间标签、功能说明）
+
+### 5. 核心观点
+- "不卷织布速，卷机器驾驭力"
+- "交付乐高式 Skills，交付拼好的乐高小车"
+- "从代码生产者转身业务审核员"
+- "弃大脑之争，筑神经之基"