预测驱动推断（Prediction-Driven Inference）

Michael I. Jordan 团队提出的统计方法，用于纠正基础模型在知识边界上的系统性偏倚。核心思想：混合少量真实标注数据与大量模型预测，使置信区间在保持窄的同时重新覆盖真实值。

问题背景

以 AlphaFold 为例：要检验"蛋白质量子涨落是否与磷酸化关联"——2×2 统计检验：

问题本质：不是模型答错了，而是模型答错了却不说。置信区间窄（看起来很有把握），但不覆盖真实值。

把少量真实标注数据（ground truth）与大量基础模型预测数据联合建模，调整置信区间的覆盖范围，使其在保持有效统计功效的同时重新覆盖真实值。

基础模型最危险的地方恰恰是科学家最需要它的地方——foundation-model-frontier-bias：

「这个矛盾不会随着数据增多自动消失。」

正式名称为 Prediction-Powered Inference (PPI)，由 Angelopoulos, Bates, Fannjiang, Jordan & Zrnic 发表于 Science 383 (2023), 669–674。