Distribución Normal Multivariada
La distribución normal multivariada generaliza la curva de campana a vectores aleatorios, caracterizada completamente por un vector de medias y una matriz de covarianza.
Definition
La distribución normal multivariada es la distribución conjunta de un vector aleatorio cuya combinación lineal de componentes es normal univariada, completamente determinada por su vector de medias y su matriz de covarianza.
Scope
Este tema cubre la densidad y la función característica de la normal multivariada, su cierre bajo transformación lineal, marginalización y condicionamiento, la relación entre covarianza cero e independencia para variables normales, la geometría de sus contornos elípticos y la distancia de Mahalanobis, y su papel como modelo asumido en la inferencia multivariada clásica.
Core questions
- ¿Qué caracteriza a la distribución normal multivariada?
- ¿Cómo se comportan las distribuciones marginales y condicionales de un vector normal?
- ¿Por qué aparece tan a menudo como una suposición de modelado?
- ¿Cómo se relaciona su geometría elíptica con la distancia de Mahalanobis?
Key theories
- Propiedades de cierre
- Las transformaciones lineales, las marginales y las condicionales de un vector normal multivariado son en sí mismas normales, y las medias condicionales son lineales con covarianza condicional constante, propiedades que hacen que la distribución sea excepcionalmente manejable.
- Geometría elíptica y distancia de Mahalanobis
- Los contornos de densidad constante son elipsoides cuyo radio al cuadrado es la distancia de Mahalanobis desde la media, que sigue una distribución chi-cuadrado y subyace a muchas estadísticas de prueba multivariadas.
Clinical relevance
El modelo normal multivariado justifica las distribuciones de muestreo utilizadas en las pruebas y estimaciones multivariadas, y sirve como distribución de componentes en el análisis discriminante gaussiano y la agrupación de mezclas gaussianas.
History
La distribución normal multivariada se desarrolló junto con la teoría de correlación y regresión a principios del siglo XX y se convirtió en la base de la teoría clásica del análisis multivariado formalizada en textos de mediados de siglo.
Debates
- Validez de la suposición de normalidad
- Muchos procedimientos clásicos asumen la normalidad multivariada, pero los datos multivariados reales a menudo muestran colas pesadas o asimetría, lo que impulsa alternativas de distribución robustas y elípticas y pruebas de normalidad multivariada.
Key figures
- T. W. Anderson
- Robb Muirhead
Related topics
Seminal works
- anderson2003
- mardia1979
- muirhead1982
Frequently asked questions
- ¿La correlación cero implica independencia para variables normales?
- Para los componentes de un único vector normal multivariado, los componentes no correlacionados son de hecho independientes; esta equivalencia es especial para la normal y no se cumple para las distribuciones en general.
- ¿Qué es la distancia de Mahalanobis?
- Es una distancia ajustada por escala y correlación desde un punto a la media; para datos normales multivariados, su cuadrado sigue una distribución chi-cuadrado y se utiliza para detectar valores atípicos y en la clasificación.