--- title: "变分自编码器 (Variational Autoencoder, VAE)" created: 2026-06-10 updated: 2026-06-10 type: concept tags: ["bayesian-deep-learning", "generative-models", "variational-inference"] sources: ["[[principled-uncertainty-clinical-ai]]"] --- # 变分自编码器 (Variational Autoencoder, VAE) **变分自编码器**(Kingma & Welling, 2014)是生成模型和表示学习的基石,将输入编码为潜空间中的概率分布(而非确定点),通过优化 ELBO(Evidence Lower BOund)进行训练。 ## 核心公式 **编码器**:q_phi(z|x) = N(z; mu_phi(x), sigma^2_phi(x) * I) **解码器**:p_theta(x|z) **ELBO 目标**: ``` L(theta, phi; x) = E_{q(z|x)}[log p(x|z)] - D_KL(q(z|x) || p(z)) ``` - 第一项:重构损失(期望对数似然) - 第二项:KL 散度正则化(潜分布趋近先验 N(0,I)) ## 重参数化技巧 ``` z = mu_phi(x) + epsilon * sigma_phi(x), epsilon ~ N(0, I) ``` 通过将随机性隔离到 epsilon,梯度可以通过采样操作回传,实现端到端训练。 ## 在临床 AI 中的应用 [[principled-uncertainty-clinical-ai|Principled Uncertainty in Clinical AI]] 使用 VAE 作为多模态编码器的基础: - 每个模态(EHR、影像、文本)都有独立的变分编码器 - 输出潜分布 (mu_m, sigma^2_m) - [[precision-weighted-fusion|精度加权融合]]组合各模态的分布 - 融合后的潜分布用于临床风险预测 ## 参考 - [[principled-uncertainty-clinical-ai|Principled Uncertainty in Clinical AI]] - [[bayesian-deep-learning|贝叶斯深度学习]] - [[epistemic-uncertainty|认知不确定性]]