55 lines
2.2 KiB
Markdown
55 lines
2.2 KiB
Markdown
---
|
||
title: "垂域 LLM 知识工程 (Vertical LLM Knowledge Engineering)"
|
||
created: 2026-06-14
|
||
updated: 2026-06-14
|
||
type: concept
|
||
tags: [llm-deployment, knowledge-engineering, vertical-domain, engineering-practice]
|
||
sources: [raw/articles/qifu-llm-finance-practice-2026.md]
|
||
---
|
||
|
||
# 垂域 LLM 知识工程 (Vertical LLM Knowledge Engineering)
|
||
|
||
奇富科技王元提出的 LLM 落地核心范式:**"通用大模型 + 高质量知识工程"** 优于盲目预训练垂类大模型。
|
||
|
||
## 核心论点
|
||
|
||
在专业领域(如金融),通用大模型的推理能力已经足够强。真正的瓶颈不是模型能力,而是**领域知识的工程化程度**:
|
||
|
||
- 专业领域数据配合小模型(14B/30B)可以超过通用大模型的 Zero-shot 能力
|
||
- 关键是打破数据壁垒,重塑知识引擎
|
||
- 实现从通用推理到垂直场景的真正落地
|
||
|
||
## 知识工程三大支柱
|
||
|
||
在金融场景中,知识工程包含三个核心环节:
|
||
|
||
### 1. 知识提取
|
||
从零散数据中提取结构化知识:
|
||
- [[reer-reverse-knowledge-extraction|REER 逆向知识提炼]] — 从 QA 对中反向提取业务手册
|
||
- LLM Wiki 方法 — 参考 Anthropic Captain 的 Markdown+Git 知识库方案
|
||
|
||
### 2. 知识组织
|
||
- Markdown 文档 + 文件系统天然结构
|
||
- Git 版本管理
|
||
- 大模型上下文能力已经足够强,混合搜索甚至可选
|
||
|
||
### 3. 知识验证
|
||
- Perplexity 下降验证(知识是否有助于推理)
|
||
- 端到端任务验证(知识是否提升业务指标)
|
||
|
||
## 与"盲目预训练"的对比
|
||
|
||
| 维度 | 通用模型 + 知识工程 | 垂域预训练 |
|
||
|------|-------------------|-----------|
|
||
| 成本 | 低(仅推理+知识维护) | 高(预训练+持续更新) |
|
||
| 灵活性 | 高(知识可热更新) | 低(需重新训练) |
|
||
| 可解释性 | 高(知识显式可审计) | 低(隐含在参数中) |
|
||
| 知识保鲜 | 文件级更新 | 全量或增量训练 |
|
||
| 适合模型规模 | 14B/30B 已足够 | 通常需要更大 |
|
||
|
||
## 参考
|
||
|
||
- [[qifu-llm-finance-practice|奇富科技金融 LLM 实践]] — 来源分享
|
||
- [[reer-reverse-knowledge-extraction|REER 逆向知识提炼]] — 知识提取方法
|
||
- [[zero-data-cold-start|零数据冷启动]] — 知识工程的极端场景
|