ScholarGate
Asistente

Proceso de Dirichlet y Modelos de Mezcla

El proceso de Dirichlet es una distribución a priori sobre distribuciones cuya discreción lo convierte en una base natural para modelos de mezcla que infieren el número de conglomerados a partir de los datos.

Encontrar tema con PaperMindPróximamenteFind papers & topics
Tools & resources
Descargar diapositivas
Learn & explore
VídeoPróximamente

Definition

El proceso de Dirichlet es un proceso estocástico cuyas realizaciones son medidas de probabilidad; un modelo de mezcla de procesos de Dirichlet convoluciona estas medidas aleatorias discretas con un kernel, produciendo una mezcla con un número aleatorio de componentes determinado por los datos.

Scope

Este tema cubre el proceso de Dirichlet y su parámetro de concentración y medida base, las representaciones del proceso de la urna de Polya y del restaurante chino, la agrupación que inducen, y el modelo de mezcla de procesos de Dirichlet utilizado para la estimación de densidad y la agrupación con un número ilimitado de componentes.

Core questions

  • ¿Cuáles son el parámetro de concentración y la medida base de un proceso de Dirichlet?
  • ¿Cómo describen la urna de Polya y el proceso del restaurante chino su agrupación?
  • ¿Cómo infiere un modelo de mezcla de procesos de Dirichlet el número de conglomerados?
  • ¿Cómo se lleva a cabo la inferencia posterior para estos modelos?

Key concepts

  • Proceso de Dirichlet
  • parámetro de concentración
  • medida base
  • proceso del restaurante chino
  • esquema de la urna de Polya
  • modelo de mezcla infinita
  • agrupación

Key theories

Proceso de Dirichlet
Ferguson definió el proceso de Dirichlet de modo que sus valores en cualquier partición finita tienen una distribución de Dirichlet, lo que proporciona una distribución a priori conjugada y casi seguramente discreta sobre las distribuciones.
Mezclas de procesos de Dirichlet
La mezcla de un kernel continuo sobre una medida distribuida por el proceso de Dirichlet produce estimaciones de densidad flexibles y agrupaciones con un número ilimitado de componentes, con inferencia mediante muestreo de Gibbs.

Clinical relevance

Las mezclas de procesos de Dirichlet realizan agrupaciones basadas en modelos y estimación de densidad sin fijar el número de grupos, lo cual es valioso en genómica, subtipificación de poblaciones y otros entornos donde el número de conglomerados es desconocido.

History

Ferguson definió el proceso de Dirichlet en 1973 y Antoniak introdujo las mezclas de procesos de Dirichlet en 1974. El enfoque de muestreo de Gibbs de Escobar y West en 1995 convirtió las mezclas de procesos de Dirichlet en una herramienta práctica para la estimación de densidad y la agrupación.

Debates

Sensibilidad al parámetro de concentración
El número de conglomerados inferidos depende del parámetro de concentración y de la medida base, por lo que las elecciones previas afectan materialmente las conclusiones de la agrupación y deben manejarse con cuidado.

Key figures

  • Thomas Ferguson
  • Charles Antoniak
  • Michael Escobar
  • Mike West

Related topics

Seminal works

  • ferguson1973
  • escobar1995

Frequently asked questions

¿Cómo decide una mezcla de procesos de Dirichlet cuántos conglomerados existen?
No fija el número de conglomerados; el proceso de Dirichlet permite un número arbitrariamente grande, y la distribución posterior, impulsada por los datos y el parámetro de concentración, asigna probabilidad a diferentes números de conglomerados ocupados.

Methods for this concept

Related concepts