狄利克雷过程与混合模型
狄利克雷过程是一种分布上的先验,其离散性使其成为混合模型的天然基础,能够从数据中推断聚类数量。
用 PaperMind 寻找选题即将推出Find papers & topics
Tools & resources
Learn & explore
视频即将推出
Definition
狄利克雷过程是一种随机过程,其实现是概率测度;狄利克雷过程混合模型将这些离散随机测度与核函数卷积,产生具有随机的、由数据确定的组分数量的混合。
Scope
本主题涵盖狄利克雷过程及其集中参数和基测度、波利亚罐子和中国餐馆过程表示、它们所诱导的聚类,以及用于密度估计和具有无限多组分的聚类的狄利克雷过程混合模型。
Core questions
- 狄利克雷过程的集中参数和基测度是什么?
- 波利亚罐子和中国餐馆过程如何描述其聚类?
- 狄利克雷过程混合模型如何推断聚类数量?
- 这些模型的后验推断是如何进行的?
Key concepts
- 狄利克雷过程
- 集中参数
- 基测度
- 中国餐馆过程
- 波利亚罐子模型
- 无限混合模型
- 聚类
Key theories
- 狄利克雷过程
- 费格森定义了狄利克雷过程,使其在任何有限划分上的值都服从狄利克雷分布,从而提供了一个共轭的、几乎必然离散的分布先验。
- 狄利克雷过程混合模型
- 将连续核函数与狄利克雷过程分布的测度混合,可以产生灵活的密度估计和具有无限多组分的聚类,并通过吉布斯采样进行推断。
Clinical relevance
狄利克雷过程混合模型在不固定组数的情况下进行基于模型的聚类和密度估计,这在基因组学、人群亚型划分以及其他聚类数量未知的情况下具有重要价值。
History
费格森于1973年定义了狄利克雷过程,安东尼亚克于1974年引入了狄利克雷过程的混合模型。埃斯科瓦尔和韦斯特于1995年提出的吉布斯采样方法使狄利克雷过程混合模型成为密度估计和聚类的实用工具。
Debates
- 对集中参数的敏感性
- 推断出的聚类数量取决于集中参数和基测度,因此先验选择会实质性地影响聚类结论,必须谨慎处理。
Key figures
- Thomas Ferguson
- Charles Antoniak
- Michael Escobar
- Mike West
Related topics
Seminal works
- ferguson1973
- escobar1995
Frequently asked questions
- 狄利克雷过程混合模型如何决定有多少个聚类?
- 它不固定聚类数量;狄利克雷过程允许任意多的聚类,而后验(由数据和集中参数驱动)将概率分配给不同数量的已占据聚类。