Tablas de contingencia y tablas 2×2
Una tabla de contingencia es una matriz rectangular de recuentos que clasifica una muestra según dos (o más) variables categóricas, mostrando cuántas observaciones caen en cada combinación de categorías. Su forma más simple e importante en la investigación en salud es la tabla 2×2, que tabula una exposición binaria frente a un resultado binario y es el punto de partida para casi todas las medidas y pruebas de asociación.
Definition
Una tabla de contingencia es una clasificación cruzada de una muestra en una cuadrícula de celdas cuyas entradas son las frecuencias de observaciones que comparten una combinación dada de categorías de dos o más variables categóricas; una tabla 2×2 es el caso especial con dos variables binarias y cuatro celdas.
Scope
Esta entrada aborda cómo se organizan los recuentos en una tabla de contingencia, la anatomía y notación de la tabla 2×2 (cuádruple), las distribuciones marginales y conjuntas que muestra, la idea de independencia entre las variables de fila y columna, y el papel de la tabla como sustrato común a partir del cual se calculan las pruebas de chi-cuadrado, las pruebas exactas y las medidas de efecto. Trata la tabla como un objeto metodológico, no como una guía clínica.
Core questions
- ¿Cómo se clasifican dos variables categóricas en celdas de recuentos?
- ¿Cuáles son los totales marginales y las frecuencias conjuntas de las celdas, y cómo se relacionan bajo la independencia?
- ¿Por qué la tabla 2×2 es el diseño canónico para una exposición binaria y un resultado binario?
- ¿Qué recuentos esperados contendrían las celdas si las variables de fila y columna fueran independientes?
Key concepts
- Filas, columnas y celdas
- Totales marginales y total general
- Distribuciones conjuntas y condicionales
- Independencia y recuentos esperados bajo independencia
- El diseño de la tabla 2×2 (cuádruple) a, b, c, d
- Tabulación cruzada de exposición por resultado
Mechanisms
Cada observación se coloca en exactamente una celda según su combinación de categorías, por lo que la tabla registra la distribución de frecuencia conjunta; la suma a lo largo de una fila o columna proporciona los totales marginales, y la división de las celdas por los márgenes da las distribuciones condicionales. Bajo la hipótesis de que las dos variables son independientes, el recuento esperado en una celda es el producto de sus totales marginales de fila y columna dividido por el total general, y las discrepancias entre los recuentos observados y esperados son lo que evalúan las pruebas de asociación. En el caso 2×2, las cuatro celdas se etiquetan convencionalmente a, b, c, d (expuesto-caso, expuesto-no caso, no expuesto-caso, no expuesto-no caso), y estos cuatro números producen directamente la razón de riesgo, la razón de probabilidades y el estadístico de chi-cuadrado. Las tablas r×c más grandes y las tablas multidimensionales extienden la misma lógica, y la estratificación de una tabla 2×2 por una tercera variable produce las tablas en capas utilizadas en el análisis de Mantel-Haenszel.
Clinical relevance
La tabla 2×2 es la forma en que con mayor frecuencia se presentan los datos de precisión diagnóstica, efecto del tratamiento y factores de riesgo, por lo que saber leer una —identificar las celdas, los márgenes y lo que se compara— es fundamental para evaluar la evidencia en salud. Es una forma de organizar y leer datos y no constituye en sí misma una base para decisiones diagnósticas o de tratamiento individuales.
Epidemiology
Los estudios de cohortes, de casos y controles, y transversales, así como los ensayos aleatorizados con resultados binarios, se condensan en su esencia en una tabla 2×2 de una exposición o intervención frente a un resultado; los estudios de pruebas diagnósticas utilizan una tabla 2×2 del resultado de la prueba frente al estado verdadero. Por lo tanto, la tabla es el punto de partida computacional compartido en los diferentes diseños de estudio en epidemiología.
History
El término “tabla de contingencia” se remonta a Karl Pearson alrededor de 1900, y el artículo de Fisher de 1922 aclaró cómo se analizan dichas tablas y los grados de libertad involucrados. La tabla cuádruple (2×2) se convirtió en la herramienta fundamental de la estadística médica del siglo XX, y los textos de referencia de Fleiss y Agresti codificaron su notación y la familia de medidas y pruebas construidas sobre ella.
Key figures
- Karl Pearson
- Ronald A. Fisher
- Joseph Fleiss
- Alan Agresti
Related topics
Seminal works
- fisher-1922
- fleiss-2003
- agresti-2013
Frequently asked questions
- ¿Qué es una tabla 2×2?
- Es la tabla de contingencia más simple: dos filas y dos columnas que clasifican una exposición (o intervención) binaria frente a un resultado binario, dando cuatro celdas cuyos recuentos se utilizan para calcular razones de riesgo, razones de probabilidades y pruebas de chi-cuadrado.
- ¿Qué significa “independencia” en una tabla de contingencia?
- Dos variables son independientes cuando la distribución de una no depende de la otra; bajo independencia, el recuento esperado en cada celda es igual al total de su fila multiplicado por el total de su columna dividido por el total general, y las pruebas de asociación miden las desviaciones de esto.