SidneyZhang/myWiki

Files

Sidney Zhang 91fac5b6fc

20260617:目前有914 页

2026-06-17 15:02:40 +08:00

2.2 KiB

Raw Blame History

title, created, updated, type, tags, sources

title

created

updated

type

tags

sources

垂域 LLM 知识工程 (Vertical LLM Knowledge Engineering)

2026-06-14

2026-06-14

concept

llm-deployment

knowledge-engineering

vertical-domain

engineering-practice

raw/articles/qifu-llm-finance-practice-2026.md

垂域 LLM 知识工程 (Vertical LLM Knowledge Engineering)

奇富科技王元提出的 LLM 落地核心范式："通用大模型 + 高质量知识工程" 优于盲目预训练垂类大模型。

核心论点

在专业领域（如金融），通用大模型的推理能力已经足够强。真正的瓶颈不是模型能力，而是领域知识的工程化程度：

专业领域数据配合小模型（14B/30B）可以超过通用大模型的 Zero-shot 能力
关键是打破数据壁垒，重塑知识引擎
实现从通用推理到垂直场景的真正落地

知识工程三大支柱

在金融场景中，知识工程包含三个核心环节：

1. 知识提取

从零散数据中提取结构化知识：

reer-reverse-knowledge-extraction — 从 QA 对中反向提取业务手册
LLM Wiki 方法 — 参考 Anthropic Captain 的 Markdown+Git 知识库方案

2. 知识组织

Markdown 文档 + 文件系统天然结构
Git 版本管理
大模型上下文能力已经足够强，混合搜索甚至可选

3. 知识验证

Perplexity 下降验证（知识是否有助于推理）
端到端任务验证（知识是否提升业务指标）

与"盲目预训练"的对比

维度	通用模型 + 知识工程	垂域预训练
成本	低（仅推理+知识维护）	高（预训练+持续更新）
灵活性	高（知识可热更新）	低（需重新训练）
可解释性	高（知识显式可审计）	低（隐含在参数中）
知识保鲜	文件级更新	全量或增量训练
适合模型规模	14B/30B 已足够	通常需要更大

参考

qifu-llm-finance-practice — 来源分享
reer-reverse-knowledge-extraction — 知识提取方法
zero-data-cold-start — 知识工程的极端场景