Files
myWiki/raw/articles/financial-llm-practice-2026.md

2.7 KiB
Raw Blame History

title, author, source, date, type, tags
title author source date type tags
金融行业大模型落地实践:从长文档检索到 Agent 工程 林金曙(恒生电子研究院 AI 首席技术专家) DataFun / DAcon 上海站 2026 2026 article
financial-llm
agent
rag
pageindex
mcp
context-engineering

金融行业大模型落地实践:从长文档检索到 Agent 工程

林金曙,恒生电子研究院 AI 首席技术专家DAcon 上海站 2026 编辑整理:韩珊珊 | 出品社区DataFun

摘要

系统梳理了金融行业落地大模型的三重挑战(合规刚性、数据安全、业务严谨性),基于恒生电子在券商、基金、银行等机构的实际项目经验,重点分享了 PageIndex 长文档检索方案、Agentic RAG 架构、金融场景"好需求"定义方法、大模型选型教训Qwen3-32B vs Qwen3-235B、上下文工程实践以及 Agent 从工具调用到自主规划的探索。

核心内容

1. 金融行业的三重约束

  • 合规:每段生成内容可溯源、结果需人工确认
  • 安全:私有化部署、数据不出域
  • 严谨:私域数据与业务系统无缝挂接,数据质量优先于模型能力

2. 场景案例

  • 机构运营200+ 件材料办理流程 → 自然语言意图转译为系统操作序列
  • 投顾理财保险条款合规判断RAG 只解决"看懂",业务闭环需调用系统接口)
  • 托管运营:信披报告自动审核(净值、勾稽关系等规则自动化)
  • 投行:蜜雪冰城 1300 页招股书 → PageIndex 方案

3. 核心工程实践

  • PageIndex:利用文档目录结构建立"章节名↔页码范围"映射,将检索从 300 页压缩到 3 页
  • Agentic RAG:任务拆解为子问题,动态调用 PageIndex/BM25/向量检索,自我评估信息充分性
  • 无向量检索金融查询大量精确匹配代码、专有名词、数字BM25 优于向量检索
  • 好需求三要素在哪里看限定章节、看什么业务语言、怎么判SOP 可执行条件)
  • 选型教训Qwen3-32B → 530 条规则/4300 行代码/三人离职Qwen3-235B → 规则砍半,准确率 +45pp
  • 上下文工程prompt 从 24K token 压缩到 3K180 个财务指标按需拼入

4. Agent 探索

  • OpenClaw 在金融场景的四短板:权限模糊、审计不足、插件无管控、幻觉无兜底
  • Skill 原子化 + MCP 协议接入
  • 接口大模型友好改造(业务语义、时间标签、功能说明)

5. 核心观点

  • "不卷织布速,卷机器驾驭力"
  • "交付乐高式 Skills交付拼好的乐高小车"
  • "从代码生产者转身业务审核员"
  • "弃大脑之争,筑神经之基"