¿Por qué es importante la normalidad?

Muchos resúmenes comunes (media, desviación estándar) y pruebas (prueba t, ANOVA) asumen datos aproximadamente normales; cuando este supuesto no se cumple, esas medidas pueden ser engañosas y las alternativas no paramétricas o transformadas pueden ser más apropiadas.

¿Es una prueba de Shapiro-Wilk significativa razón suficiente para abandonar un método paramétrico?

No por sí sola. La prueba se vuelve muy sensible en muestras grandes y tiene poca potencia en muestras pequeñas, por lo que se deben considerar el tamaño de la desviación, la forma observada en un gráfico Q-Q y la robustez del análisis planificado.

Distribución de Datos y Normalidad

La distribución de una variable describe cómo sus valores se extienden a lo largo del rango de posibilidades, y muchos métodos descriptivos e inferenciales dependen de la forma de dicha distribución. La normalidad —es decir, si los datos siguen la distribución normal simétrica en forma de campana— es la suposición distribucional que se examina con mayor frecuencia en la investigación en salud, ya que rige la elección entre resúmenes y pruebas paramétricas y no paramétricas.

Encontrar tema con PaperMindPróximamenteFind papers & topics

Tools & resources

Descargar diapositivas

Learn & explore

VídeoPróximamente

Definition

Una distribución estadística describe la frecuencia relativa o la probabilidad de los posibles valores de una variable; la normalidad se refiere a la conformidad con la distribución gaussiana (normal), una forma simétrica en forma de campana que se evalúa gráficamente y con pruebas formales para decidir si los métodos paramétricos son apropiados.

Scope

Esta entrada abarca la forma distribucional (simetría, asimetría, curtosis), la distribución normal y su importancia, y cómo se evalúa la normalidad mediante inspección gráfica y pruebas formales. Es una referencia metodológica y no proporciona orientación clínica.

Core questions

¿Qué forma adopta la distribución de la variable y es simétrica o asimétrica?
¿Es razonable el supuesto de normalidad para esta variable?
¿Qué herramientas gráficas y formales evalúan mejor la normalidad, y cómo se comportan con muestras pequeñas o grandes?

Key concepts

Distribución normal (gaussiana)
Asimetría y curtosis
Evaluación gráfica (histograma, gráfico Q-Q)
Prueba de Shapiro-Wilk
Prueba de Kolmogorov-Smirnov
Elección paramétrica versus no paramétrica
Sensibilidad al tamaño de la muestra de las pruebas de normalidad

Key theories

Teorema del límite central: El teorema del límite central establece que, para una muestra suficientemente grande, la distribución muestral de la media se aproxima a una distribución normal, independientemente de la forma de la variable subyacente. Es la razón por la que los métodos basados en la teoría normal a menudo siguen siendo útiles para las medias, incluso cuando los datos brutos no son normales.

Mechanisms

La normalidad se evalúa de dos maneras complementarias. Los métodos gráficos —el histograma y el gráfico cuantil-cuantil (Q-Q)— muestran directamente desviaciones como asimetría, colas pesadas o bimodalidad. Las pruebas formales, de las cuales la prueba de Shapiro-Wilk es una de las más utilizadas, devuelven una probabilidad de observar los datos bajo un modelo normal. Dado que estas pruebas aumentan su potencia con el tamaño de la muestra, tienden a señalar desviaciones triviales en muestras grandes y a pasar por alto desviaciones significativas en muestras pequeñas, por lo que la inspección gráfica y las consecuencias prácticas de la no normalidad se sopesan junto con cualquier resultado de la prueba. Cuando la cantidad de interés es una media, el teorema del límite central a menudo justifica los métodos basados en la teoría normal incluso para datos brutos no normales.

Clinical relevance

El hecho de que un biomarcador, la duración de la estancia o una puntuación se traten como normales determina cómo se resumen y analizan en la literatura clínica, por lo que juzgar la normalidad forma parte de la evaluación de los métodos de un estudio. Esta entrada describe la evaluación de los supuestos distribucionales y no constituye una base para decisiones individuales de diagnóstico o tratamiento.

Epidemiology

Muchas mediciones biológicas y clínicas presentan asimetría positiva (por ejemplo, niveles hormonales, costos y tiempos de espera), por lo que la normalidad no puede asumirse y se verifica de forma rutinaria. La decisión influye en si los resultados se informan con medias y desviaciones estándar o con medianas y rangos, y si se utilizan pruebas paramétricas o no paramétricas.

History

La distribución normal se desarrolló en los siglos XVIII y XIX en la obra de de Moivre, Laplace y Gauss, y se convirtió en un elemento central de la estadística a través de la teoría de errores y el teorema del límite central. Las herramientas formales para verificar este supuesto surgieron en el siglo XX, y la prueba de normalidad de análisis de varianza de Shapiro y Wilk de 1965 se convirtió en un procedimiento estándar en el trabajo aplicado.

Debates

¿Debe juzgarse la normalidad mediante pruebas formales o por inspección gráfica?: Las pruebas formales de normalidad son sensibles al tamaño de la muestra —rechazando desviaciones triviales en muestras grandes y no detectando desviaciones importantes en muestras pequeñas— por lo que muchos metodólogos recomiendan que la evaluación gráfica y la robustez práctica del análisis planificado guíen la decisión, en lugar de solo el valor p de una prueba.

Key figures

Samuel S. Shapiro
Martin B. Wilk
Carl Friedrich Gauss

Seminal works

shapiro-wilk-1965
kwak-2017
ghasemi-2012

Frequently asked questions

¿Por qué es importante la normalidad?: Muchos resúmenes comunes (media, desviación estándar) y pruebas (prueba t, ANOVA) asumen datos aproximadamente normales; cuando este supuesto no se cumple, esas medidas pueden ser engañosas y las alternativas no paramétricas o transformadas pueden ser más apropiadas.
¿Es una prueba de Shapiro-Wilk significativa razón suficiente para abandonar un método paramétrico?: No por sí sola. La prueba se vuelve muy sensible en muestras grandes y tiene poca potencia en muestras pequeñas, por lo que se deben considerar el tamaño de la desviación, la forma observada en un gráfico Q-Q y la robustez del análisis planificado.