20260617:目前有914 页
This commit is contained in:
69
papers/principled-uncertainty-clinical-ai.md
Normal file
69
papers/principled-uncertainty-clinical-ai.md
Normal file
@@ -0,0 +1,69 @@
|
||||
---
|
||||
title: "Principled Uncertainty in Clinical AI: Bayesian Modelling and Equity Auditing"
|
||||
created: 2026-06-10
|
||||
updated: 2026-06-10
|
||||
type: paper
|
||||
tags: ["bayesian-deep-learning", "uncertainty-quantification", "algorithmic-equity", "clinical-ai", "multimodal-fusion"]
|
||||
sources: ["https://arxiv.org/abs/2606.09789"]
|
||||
---
|
||||
|
||||
# Principled Uncertainty in Clinical AI
|
||||
|
||||
**Authors**: Oladimeji Anthonio, Dimeji Abdulsobur Olawuyi, Oloruntoba Ajayi, Temiloluwa Aderemi, Joseph Odamo
|
||||
**Venue**: arXiv:2606.09789v1 [cs.CY], 2026
|
||||
**Affiliation**: Centre for Algorithmic Health Equity, Ibadan, Nigeria
|
||||
|
||||
## 核心问题
|
||||
|
||||
临床 AI 系统大量生产确定性预测(点估计),却不提供任何置信度或可靠性度量。这导致两个后果:技术上,模型无法区分高置信场景与分布外输入;公平性上,系统性地对弱势群体的失败完全不可见。
|
||||
|
||||
## 方法论贡献
|
||||
|
||||
提出了**端到端贝叶斯不确定性建模框架**,将分布表示传播到多模态预测管线的每一个阶段:
|
||||
|
||||
1. **模态特定变分编码器**([[variational-autoencoder|VAE]] 基础):将 EHR(32维)、医学影像特征(128维)、临床文本嵌入(64维)映射到共享 16 维潜空间
|
||||
2. **精度加权晚期融合**([[precision-weighted-fusion]]):利用各模态精度 Λ_m = 1/σ²_m 进行加权组合,缺失模态自动排除(log σ² → 10.0)
|
||||
3. **分解不确定性输出头**([[uncertainty-quantification]]):分离 [[aleatoric-uncertainty]](Softplus 激活)和 [[epistemic-uncertainty]]([[mc-dropout]] T 次前向传播方差)
|
||||
4. **复合贝叶斯损失**:L_total = L_pred + β_KL·L_KL + β_unc·L_unc
|
||||
|
||||
## 关键发现
|
||||
|
||||
**校准性能**:ECE = 0.096,缺失影像数据患者不确定性提升 +42.2%
|
||||
|
||||
**公平性审计**(核心贡献)——将校准后的不确定性作为算法公平性的形式化度量:
|
||||
|
||||
| 子群体轴 | UEG | p 值 | 效应量 r |
|
||||
|---------|-----|------|---------|
|
||||
| 设施类型(初级/农村 vs 三级) | 15.3% | <0.001 | 0.698 |
|
||||
| 社会经济地位(低 vs 高 SES) | 6.8% | <0.001 | 0.617 |
|
||||
| 年龄组(老年 vs 成人) | 3.9% | <0.001 | 0.575 |
|
||||
| 生物性别 | 0.5% | 0.909 | — |
|
||||
|
||||
标准准确率指标无法检测这些差异(农村 85.5% vs 三级 82.6%,仅差 2.9pp),而不确定性差距高达 15.3%。
|
||||
|
||||
## 核心论点
|
||||
|
||||
**不确定性不是需要最小化的局限,而是需要度量、报告并采取行动的公平性信号。** 高认知不确定性标志着模型训练数据未能充分代表该患者——在数据质量与资源可用性相关的医疗体系中,这反映了历史性健康不平等的部分映射。
|
||||
|
||||
## 局限性
|
||||
- 合成数据评估(1,000 患者),外部效度有限
|
||||
- 固定潜空间维度,未采用层次化潜空间
|
||||
- 公平性指标量化差异但未归因到具体原因
|
||||
|
||||
## 相关概念
|
||||
- [[epistemic-uncertainty|认知不确定性]]
|
||||
- [[aleatoric-uncertainty|随机不确定性]]
|
||||
- [[uncertainty-quantification|不确定性量化]]
|
||||
- [[bayesian-deep-learning|贝叶斯深度学习]]
|
||||
- [[expected-calibration-error|预期校准误差]]
|
||||
- [[uncertainty-equity-gap|不确定性公平性差距]]
|
||||
- [[uncertainty-disparity-ratio|不确定性差异比]]
|
||||
- [[precision-weighted-fusion|精度加权融合]]
|
||||
- [[mc-dropout|MC Dropout]]
|
||||
- [[algorithmic-equity|算法公平性]]
|
||||
- [[clinical-ai|临床人工智能]]
|
||||
- [[variational-autoencoder|变分自编码器]]
|
||||
|
||||
## 来源
|
||||
- [arXiv](https://arxiv.org/abs/2606.09789)
|
||||
- [原始存档](raw/papers/anthonio-principled-uncertainty-clinical-ai-2026.md)
|
||||
Reference in New Issue
Block a user