--- title: "垂域 LLM 知识工程 (Vertical LLM Knowledge Engineering)" created: 2026-06-14 updated: 2026-06-14 type: concept tags: [llm-deployment, knowledge-engineering, vertical-domain, engineering-practice] sources: [raw/articles/qifu-llm-finance-practice-2026.md] --- # 垂域 LLM 知识工程 (Vertical LLM Knowledge Engineering) 奇富科技王元提出的 LLM 落地核心范式:**"通用大模型 + 高质量知识工程"** 优于盲目预训练垂类大模型。 ## 核心论点 在专业领域(如金融),通用大模型的推理能力已经足够强。真正的瓶颈不是模型能力,而是**领域知识的工程化程度**: - 专业领域数据配合小模型(14B/30B)可以超过通用大模型的 Zero-shot 能力 - 关键是打破数据壁垒,重塑知识引擎 - 实现从通用推理到垂直场景的真正落地 ## 知识工程三大支柱 在金融场景中,知识工程包含三个核心环节: ### 1. 知识提取 从零散数据中提取结构化知识: - [[reer-reverse-knowledge-extraction|REER 逆向知识提炼]] — 从 QA 对中反向提取业务手册 - LLM Wiki 方法 — 参考 Anthropic Captain 的 Markdown+Git 知识库方案 ### 2. 知识组织 - Markdown 文档 + 文件系统天然结构 - Git 版本管理 - 大模型上下文能力已经足够强,混合搜索甚至可选 ### 3. 知识验证 - Perplexity 下降验证(知识是否有助于推理) - 端到端任务验证(知识是否提升业务指标) ## 与"盲目预训练"的对比 | 维度 | 通用模型 + 知识工程 | 垂域预训练 | |------|-------------------|-----------| | 成本 | 低(仅推理+知识维护) | 高(预训练+持续更新) | | 灵活性 | 高(知识可热更新) | 低(需重新训练) | | 可解释性 | 高(知识显式可审计) | 低(隐含在参数中) | | 知识保鲜 | 文件级更新 | 全量或增量训练 | | 适合模型规模 | 14B/30B 已足够 | 通常需要更大 | ## 参考 - [[qifu-llm-finance-practice|奇富科技金融 LLM 实践]] — 来源分享 - [[reer-reverse-knowledge-extraction|REER 逆向知识提炼]] — 知识提取方法 - [[zero-data-cold-start|零数据冷启动]] — 知识工程的极端场景