20260625:很多新内容
This commit is contained in:
49
raw/articles/financial-llm-practice-2026.md
Normal file
49
raw/articles/financial-llm-practice-2026.md
Normal file
@@ -0,0 +1,49 @@
|
||||
---
|
||||
title: "金融行业大模型落地实践:从长文档检索到 Agent 工程"
|
||||
author: "林金曙(恒生电子研究院 AI 首席技术专家)"
|
||||
source: "DataFun / DAcon 上海站 2026"
|
||||
date: "2026"
|
||||
type: "article"
|
||||
tags: ["financial-llm", "agent", "rag", "pageindex", "mcp", "context-engineering"]
|
||||
---
|
||||
|
||||
# 金融行业大模型落地实践:从长文档检索到 Agent 工程
|
||||
|
||||
> 林金曙,恒生电子研究院 AI 首席技术专家,DAcon 上海站 2026
|
||||
> 编辑整理:韩珊珊 | 出品社区:DataFun
|
||||
|
||||
## 摘要
|
||||
|
||||
系统梳理了金融行业落地大模型的三重挑战(合规刚性、数据安全、业务严谨性),基于恒生电子在券商、基金、银行等机构的实际项目经验,重点分享了 PageIndex 长文档检索方案、Agentic RAG 架构、金融场景"好需求"定义方法、大模型选型教训(Qwen3-32B vs Qwen3-235B)、上下文工程实践,以及 Agent 从工具调用到自主规划的探索。
|
||||
|
||||
## 核心内容
|
||||
|
||||
### 1. 金融行业的三重约束
|
||||
- **合规**:每段生成内容可溯源、结果需人工确认
|
||||
- **安全**:私有化部署、数据不出域
|
||||
- **严谨**:私域数据与业务系统无缝挂接,数据质量优先于模型能力
|
||||
|
||||
### 2. 场景案例
|
||||
- **机构运营**:200+ 件材料办理流程 → 自然语言意图转译为系统操作序列
|
||||
- **投顾理财**:保险条款合规判断(RAG 只解决"看懂",业务闭环需调用系统接口)
|
||||
- **托管运营**:信披报告自动审核(净值、勾稽关系等规则自动化)
|
||||
- **投行**:蜜雪冰城 1300 页招股书 → PageIndex 方案
|
||||
|
||||
### 3. 核心工程实践
|
||||
- **PageIndex**:利用文档目录结构建立"章节名↔页码范围"映射,将检索从 300 页压缩到 3 页
|
||||
- **Agentic RAG**:任务拆解为子问题,动态调用 PageIndex/BM25/向量检索,自我评估信息充分性
|
||||
- **无向量检索**:金融查询大量精确匹配(代码、专有名词、数字),BM25 优于向量检索
|
||||
- **好需求三要素**:在哪里看(限定章节)、看什么(业务语言)、怎么判(SOP 可执行条件)
|
||||
- **选型教训**:Qwen3-32B → 530 条规则/4300 行代码/三人离职;Qwen3-235B → 规则砍半,准确率 +45pp
|
||||
- **上下文工程**:prompt 从 24K token 压缩到 3K,180 个财务指标按需拼入
|
||||
|
||||
### 4. Agent 探索
|
||||
- OpenClaw 在金融场景的四短板:权限模糊、审计不足、插件无管控、幻觉无兜底
|
||||
- Skill 原子化 + MCP 协议接入
|
||||
- 接口大模型友好改造(业务语义、时间标签、功能说明)
|
||||
|
||||
### 5. 核心观点
|
||||
- "不卷织布速,卷机器驾驭力"
|
||||
- "交付乐高式 Skills,交付拼好的乐高小车"
|
||||
- "从代码生产者转身业务审核员"
|
||||
- "弃大脑之争,筑神经之基"
|
||||
Reference in New Issue
Block a user