Files
myWiki/concepts/vertical-llm-knowledge-engineering.md

55 lines
2.2 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

---
title: "垂域 LLM 知识工程 (Vertical LLM Knowledge Engineering)"
created: 2026-06-14
updated: 2026-06-14
type: concept
tags: [llm-deployment, knowledge-engineering, vertical-domain, engineering-practice]
sources: [raw/articles/qifu-llm-finance-practice-2026.md]
---
# 垂域 LLM 知识工程 (Vertical LLM Knowledge Engineering)
奇富科技王元提出的 LLM 落地核心范式:**"通用大模型 + 高质量知识工程"** 优于盲目预训练垂类大模型。
## 核心论点
在专业领域(如金融),通用大模型的推理能力已经足够强。真正的瓶颈不是模型能力,而是**领域知识的工程化程度**
- 专业领域数据配合小模型14B/30B可以超过通用大模型的 Zero-shot 能力
- 关键是打破数据壁垒,重塑知识引擎
- 实现从通用推理到垂直场景的真正落地
## 知识工程三大支柱
在金融场景中,知识工程包含三个核心环节:
### 1. 知识提取
从零散数据中提取结构化知识:
- [[reer-reverse-knowledge-extraction|REER 逆向知识提炼]] — 从 QA 对中反向提取业务手册
- LLM Wiki 方法 — 参考 Anthropic Captain 的 Markdown+Git 知识库方案
### 2. 知识组织
- Markdown 文档 + 文件系统天然结构
- Git 版本管理
- 大模型上下文能力已经足够强,混合搜索甚至可选
### 3. 知识验证
- Perplexity 下降验证(知识是否有助于推理)
- 端到端任务验证(知识是否提升业务指标)
## 与"盲目预训练"的对比
| 维度 | 通用模型 + 知识工程 | 垂域预训练 |
|------|-------------------|-----------|
| 成本 | 低(仅推理+知识维护) | 高(预训练+持续更新) |
| 灵活性 | 高(知识可热更新) | 低(需重新训练) |
| 可解释性 | 高(知识显式可审计) | 低(隐含在参数中) |
| 知识保鲜 | 文件级更新 | 全量或增量训练 |
| 适合模型规模 | 14B/30B 已足够 | 通常需要更大 |
## 参考
- [[qifu-llm-finance-practice|奇富科技金融 LLM 实践]] — 来源分享
- [[reer-reverse-knowledge-extraction|REER 逆向知识提炼]] — 知识提取方法
- [[zero-data-cold-start|零数据冷启动]] — 知识工程的极端场景