1.6 KiB
1.6 KiB
title, created, updated, type, tags, sources
| title | created | updated | type | tags | sources | ||||
|---|---|---|---|---|---|---|---|---|---|
| 变分自编码器 (Variational Autoencoder, VAE) | 2026-06-10 | 2026-06-10 | concept |
|
|
变分自编码器 (Variational Autoencoder, VAE)
变分自编码器(Kingma & Welling, 2014)是生成模型和表示学习的基石,将输入编码为潜空间中的概率分布(而非确定点),通过优化 ELBO(Evidence Lower BOund)进行训练。
核心公式
编码器:q_phi(z|x) = N(z; mu_phi(x), sigma^2_phi(x) * I)
解码器:p_theta(x|z)
ELBO 目标:
L(theta, phi; x) = E_{q(z|x)}[log p(x|z)] - D_KL(q(z|x) || p(z))
- 第一项:重构损失(期望对数似然)
- 第二项:KL 散度正则化(潜分布趋近先验 N(0,I))
重参数化技巧
z = mu_phi(x) + epsilon * sigma_phi(x), epsilon ~ N(0, I)
通过将随机性隔离到 epsilon,梯度可以通过采样操作回传,实现端到端训练。
在临床 AI 中的应用
principled-uncertainty-clinical-ai 使用 VAE 作为多模态编码器的基础:
- 每个模态(EHR、影像、文本)都有独立的变分编码器
- 输出潜分布 (mu_m, sigma^2_m)
- precision-weighted-fusion组合各模态的分布
- 融合后的潜分布用于临床风险预测