金融行业大模型落地实践：从长文档检索到 Agent 工程

林金曙，恒生电子研究院 AI 首席技术专家，DAcon 上海站 2026 编辑整理：韩珊珊 | 出品社区：DataFun

摘要

系统梳理了金融行业落地大模型的三重挑战（合规刚性、数据安全、业务严谨性），基于恒生电子在券商、基金、银行等机构的实际项目经验，重点分享了 PageIndex 长文档检索方案、Agentic RAG 架构、金融场景"好需求"定义方法、大模型选型教训（Qwen3-32B vs Qwen3-235B）、上下文工程实践，以及 Agent 从工具调用到自主规划的探索。

核心内容

1. 金融行业的三重约束

合规：每段生成内容可溯源、结果需人工确认
安全：私有化部署、数据不出域
严谨：私域数据与业务系统无缝挂接，数据质量优先于模型能力

2. 场景案例

机构运营：200+ 件材料办理流程 → 自然语言意图转译为系统操作序列
投顾理财：保险条款合规判断（RAG 只解决"看懂"，业务闭环需调用系统接口）
托管运营：信披报告自动审核（净值、勾稽关系等规则自动化）
投行：蜜雪冰城 1300 页招股书 → PageIndex 方案

3. 核心工程实践

PageIndex：利用文档目录结构建立"章节名↔页码范围"映射，将检索从 300 页压缩到 3 页
Agentic RAG：任务拆解为子问题，动态调用 PageIndex/BM25/向量检索，自我评估信息充分性
无向量检索：金融查询大量精确匹配（代码、专有名词、数字），BM25 优于向量检索
好需求三要素：在哪里看（限定章节）、看什么（业务语言）、怎么判（SOP 可执行条件）
选型教训：Qwen3-32B → 530 条规则/4300 行代码/三人离职；Qwen3-235B → 规则砍半，准确率 +45pp
上下文工程：prompt 从 24K token 压缩到 3K，180 个财务指标按需拼入

4. Agent 探索

OpenClaw 在金融场景的四短板：权限模糊、审计不足、插件无管控、幻觉无兜底
Skill 原子化 + MCP 协议接入
接口大模型友好改造（业务语义、时间标签、功能说明）

5. 核心观点

"不卷织布速，卷机器驾驭力"
"交付乐高式 Skills，交付拼好的乐高小车"
"从代码生产者转身业务审核员"
"弃大脑之争，筑神经之基"

2.7 KiB Raw Blame History Unescape Escape

金融行业大模型落地实践：从长文档检索到 Agent 工程

摘要

核心内容

1. 金融行业的三重约束

2. 场景案例

3. 核心工程实践

4. Agent 探索

5. 核心观点

2.7 KiB

Raw Blame History