---
title: "变分自编码器 (Variational Autoencoder, VAE)"
created: 2026-06-10
updated: 2026-06-10
type: concept
tags: ["bayesian-deep-learning", "generative-models", "variational-inference"]
sources: ["[[principled-uncertainty-clinical-ai]]"]
---

# 变分自编码器 (Variational Autoencoder, VAE)

**变分自编码器**（Kingma & Welling, 2014）是生成模型和表示学习的基石，将输入编码为潜空间中的概率分布（而非确定点），通过优化 ELBO（Evidence Lower BOund）进行训练。

## 核心公式

**编码器**：q_phi(z|x) = N(z; mu_phi(x), sigma^2_phi(x) * I)

**解码器**：p_theta(x|z)

**ELBO 目标**：
```
L(theta, phi; x) = E_{q(z|x)}[log p(x|z)] - D_KL(q(z|x) || p(z))
```
- 第一项：重构损失（期望对数似然）
- 第二项：KL 散度正则化（潜分布趋近先验 N(0,I)）

## 重参数化技巧

```
z = mu_phi(x) + epsilon * sigma_phi(x), epsilon ~ N(0, I)
```

通过将随机性隔离到 epsilon，梯度可以通过采样操作回传，实现端到端训练。

## 在临床 AI 中的应用

[[principled-uncertainty-clinical-ai|Principled Uncertainty in Clinical AI]] 使用 VAE 作为多模态编码器的基础：

- 每个模态（EHR、影像、文本）都有独立的变分编码器
- 输出潜分布 (mu_m, sigma^2_m)
- [[precision-weighted-fusion|精度加权融合]]组合各模态的分布
- 融合后的潜分布用于临床风险预测

## 参考
- [[principled-uncertainty-clinical-ai|Principled Uncertainty in Clinical AI]]
- [[bayesian-deep-learning|贝叶斯深度学习]]
- [[epistemic-uncertainty|认知不确定性]]