我应该何时使用变分推断而不是MCMC？

当数据集或模型过大导致MCMC不可行且快速的近似后验可接受时，变分推断具有吸引力；当精确的不确定性量化至关重要时，MCMC仍然是更优选择，因为变分方法倾向于低估后验方差。

变分推断

变分推断将后验近似转化为优化问题，通过最大化边际似然的下界，使一个更简单的分布拟合后验。

用 PaperMind 寻找选题即将推出Find papers & topics

Tools & resources

Learn & explore

视频即将推出

变分推断通过从一个易处理的分布族中选择一个成员来近似一个难以处理的后验，该成员能最小化与后验之间的Kullback-Leibler散度，这等价于最大化对数边际似然的证据下界。

本主题涵盖变分目标（证据下界）、平均场族及其分解假设、坐标上升和随机梯度算法，以及速度与近似推断系统偏差之间的权衡。

变分推断将贝叶斯方法扩展到文本分析、基因组学和深度学习中的大型数据集和复杂模型，在这些领域，完全MCMC的成本过高，而快速的近似后验就足够了。

变分方法在1990年代后期通过图形模型的平均场近似进入机器学习领域。Blei及其同事在2017年综述的2010年代的随机和自动变分推断，将可扩展的近似贝叶斯推断引入主流统计学和概率编程。

我应该何时使用变分推断而不是MCMC？: 当数据集或模型过大导致MCMC不可行且快速的近似后验可接受时，变分推断具有吸引力；当精确的不确定性量化至关重要时，MCMC仍然是更优选择，因为变分方法倾向于低估后验方差。