Pruebas de Chi-cuadrado y Exacta de Fisher
La prueba de chi-cuadrado y la prueba exacta de Fisher son los dos procedimientos estándar para determinar si dos variables categóricas en una tabla de contingencia están asociadas o son independientes. La prueba de chi-cuadrado compara las frecuencias observadas en las celdas con las esperadas bajo la hipótesis de independencia, utilizando una aproximación para muestras grandes, mientras que la prueba exacta de Fisher calcula directamente la probabilidad de la tabla observada y se utiliza cuando las frecuencias son pequeñas.
Definition
La prueba de chi-cuadrado de asociación mide la discrepancia entre las frecuencias observadas y esperadas en las celdas bajo la hipótesis nula de independencia, refiriendo el estadístico resultante a una distribución de chi-cuadrado; la prueba exacta de Fisher, en cambio, calcula, a partir de la distribución hipergeométrica con los márgenes fijos, la probabilidad exacta de tablas tan o más extremas que la observada.
Scope
Esta entrada aborda el estadístico chi-cuadrado de Pearson y sus grados de libertad, la condición de frecuencias esperadas que justifica la aproximación de chi-cuadrado, la corrección de continuidad (de Yates), la lógica de la prueba exacta de Fisher basada en la distribución hipergeométrica, y la cuestión práctica de cuándo una prueba exacta debe reemplazar a la aproximación. Se presentan estas pruebas como herramientas para evaluar la asociación, no como guía clínica, y se señala que evalúan si existe una asociación, no su magnitud.
Core questions
- ¿Son independientes las dos variables categóricas en esta tabla, o existe evidencia de asociación?
- ¿Cómo se forma el estadístico chi-cuadrado a partir de las frecuencias observadas y esperadas, y cuántos grados de libertad tiene?
- ¿Cuándo son las frecuencias esperadas demasiado pequeñas para que la aproximación de chi-cuadrado sea fiable?
- ¿Cómo evita la prueba exacta de Fisher la aproximación para muestras grandes, y qué significa 'condicionar sobre los márgenes'?
Key concepts
- Frecuencias observadas versus esperadas
- Estadístico chi-cuadrado de Pearson
- Grados de libertad (r-1)(c-1)
- Aproximación para muestras grandes (asintótica)
- Regla empírica de las frecuencias esperadas
- Corrección de continuidad de Yates
- Distribución hipergeométrica y márgenes fijos
- Valores p exactos versus asintóticos
Mechanisms
Bajo la independencia, la frecuencia esperada de cada celda es el total de su fila multiplicado por el total de su columna, dividido por el total general. El estadístico chi-cuadrado de Pearson suma la diferencia al cuadrado entre las frecuencias observadas y esperadas, dividida por la frecuencia esperada, en todas las celdas; para una tabla r×c, este estadístico se compara con una distribución de chi-cuadrado con (r−1)(c−1) grados de libertad, resultado que Fisher clarificó en 1922. La aproximación se deteriora cuando las frecuencias esperadas son pequeñas, lo que lleva a la guía común de que las frecuencias esperadas generalmente deberían exceder aproximadamente cinco; la corrección de continuidad de Yates se propuso para mejorar la aproximación en tablas 2×2. La prueba exacta de Fisher evita la aproximación al tratar los márgenes de fila y columna como fijos y calcular, a partir de la distribución hipergeométrica, la probabilidad exacta de la tabla observada y de cada tabla más extrema, sumándolas para obtener un valor p. Debido a que es exacta, se prefiere para tablas dispersas, aunque las revisiones señalan su naturaleza condicional y conservadora y recomiendan elecciones específicas entre las pruebas disponibles.
Clinical relevance
Si un estudio informa que una exposición está o no asociada con un resultado a menudo depende de una de estas pruebas, por lo que comprender su funcionamiento —y que un valor p pequeño señala una asociación pero no dice nada sobre su magnitud— es parte de la evaluación de la investigación en salud. Estas pruebas son herramientas para evaluar la evidencia de asociación y no constituyen una base para decisiones diagnósticas o de tratamiento individuales.
Epidemiology
Las pruebas de chi-cuadrado y exacta de Fisher son las pruebas de significación predeterminadas para tablas de contingencia 2×2 y mayores en epidemiología e investigación clínica, acompañando a las razones de riesgo (risk ratios) y razones de posibilidades (odds ratios) que cuantifican las mismas asociaciones. La prueba exacta se invoca rutinariamente para muestras pequeñas o eventos raros donde la aproximación de chi-cuadrado no es fiable.
History
Karl Pearson introdujo el estadístico chi-cuadrado de bondad de ajuste en 1900; el artículo de Fisher de 1922 corrigió los grados de libertad para tablas de contingencia, y Fisher ideó más tarde la prueba exacta que lleva su nombre para muestras pequeñas. Yates propuso su corrección de continuidad para tablas 2×2 en 1934. La recomendación moderna entre estos y procedimientos relacionados se ha sintetizado en revisiones metodológicas y libros de texto.
Debates
- Pruebas exactas versus asintóticas para tablas 2×2 pequeñas
- La prueba exacta de Fisher condiciona sobre ambos márgenes y es exacta, pero tiende a ser conservadora, mientras que el chi-cuadrado sin corregir puede ser anti-conservador para muestras pequeñas y la corrección de Yates corrige en exceso; por lo tanto, las revisiones ofrecen recomendaciones matizadas en lugar de una regla única.
Key figures
- Karl Pearson
- Ronald A. Fisher
- Frank Yates
- Alan Agresti
Related topics
Seminal works
- pearson-1900
- fisher-1922
- lydersen-2009
Frequently asked questions
- ¿Cuándo se debe usar la prueba exacta de Fisher en lugar de la prueba de chi-cuadrado?
- Cuando la tabla es pequeña o dispersa —típicamente cuando una o más frecuencias esperadas en las celdas son bajas— la aproximación de chi-cuadrado para muestras grandes puede no ser fiable, y se prefiere la prueba exacta de Fisher, que calcula una probabilidad exacta.
- ¿Una prueba de chi-cuadrado significativa indica la fuerza de la asociación?
- No. Estas pruebas indican si existe evidencia de una asociación; la magnitud de la asociación se transmite mediante una medida de efecto separada, como una razón de riesgo (risk ratio) o una razón de posibilidades (odds ratio), que debe informarse junto con el valor p.