Files
myWiki/concepts/zero-data-cold-start.md

1.8 KiB
Raw Blame History

title, created, updated, type, tags, sources
title created updated type tags sources
零数据冷启动 (Zero-Data Cold Start) 2026-06-14 2026-06-14 concept
data-scarcity
cold-start
llm-deployment
finance
raw/articles/qifu-llm-finance-practice-2026.md

零数据冷启动 (Zero-Data Cold Start)

奇富科技王元描述的金融 LLM 落地的极端数据困境:不仅没有标注,连输入 X 都没有——XY 全部缺失,连传统的监督微调都无法启动。

典型案例

银行营销业务的商机挖掘场景:

  • 需要提取约 100 多类标签和商机软信息
  • 业务流程变更前没有历史录音
  • 没有商机标签的 Ground Truth
  • 意味着输入 X 和标签 Y 都不存在

与大模型蒸馏的叠加困难

即使人工造少量测试数据:

  • 用主流大模型Gemini, MiniMax 2.5/2.7)测试标签 F1 仅 70%+
  • 无法用大模型做传统蒸馏提升小模型
  • 只能从基模做 LoRA 后训练,依赖比测试数据多一个数量级的训练数据

解决方案

与常规冷启动的区别

维度 常规冷启动 零数据冷启动
数据存在性 X 存在Y 缺失 X 和 Y 都缺失
启动方式 无监督/半监督/主动学习 全合成数据
验证难度 可人工标注少量验证 验证集也需要构造
典型领域 推荐系统、搜索 新业务流程、合规受限

参考