Pruebas de Hipótesis Múltiples
Cuando se prueban muchas hipótesis a la vez, se acumulan los falsos positivos; los procedimientos de pruebas múltiples controlan el error global a costa de cierta potencia.
Definition
La prueba de hipótesis múltiples es la evaluación simultánea de varias hipótesis con procedimientos que controlan un criterio de error global, como la probabilidad de cualquier rechazo falso o la proporción esperada de rechazos falsos.
Scope
Este tema abarca el problema de la multiplicidad y la inflación de falsos positivos, la tasa de error familiar (family-wise error rate) y los procedimientos que la controlan, como Bonferroni, Holm y Sidak, la tasa de descubrimiento falso (false discovery rate) y el procedimiento de Benjamini-Hochberg, la distinción entre control débil y fuerte, la dependencia entre pruebas y la compensación entre el control de errores y la potencia de detección en pruebas a gran escala.
Core questions
- ¿Por qué la prueba de muchas hipótesis infla la probabilidad de al menos un falso positivo?
- ¿Cómo controlan los procedimientos de Bonferroni y Holm la tasa de error familiar?
- ¿Qué es la tasa de descubrimiento falso y cómo la controla el procedimiento de Benjamini-Hochberg?
- ¿Cómo afecta la dependencia entre las pruebas a estas garantías?
Key theories
- Control de la tasa de error familiar (family-wise error rate)
- El procedimiento de Bonferroni limita la probabilidad de cualquier rechazo falso dividiendo el nivel entre las pruebas; el procedimiento escalonado de Holm logra el mismo control con mayor potencia.
- Tasa de descubrimiento falso y Benjamini-Hochberg
- En lugar de prevenir cualquier rechazo falso, la tasa de descubrimiento falso controla la fracción esperada de rechazos que son falsos; el procedimiento escalonado de Benjamini-Hochberg la controla y es mucho más potente para un gran número de pruebas.
Clinical relevance
El control de pruebas múltiples es esencial en estudios de asociación de genoma completo, neuroimagen y cribado de alto rendimiento, donde se prueban miles de hipótesis a la vez y los métodos de tasa de descubrimiento falso determinan qué hallazgos se informan como descubrimientos.
History
La preocupación por las comparaciones múltiples se remonta a Tukey y al trabajo de inferencia simultánea de mediados del siglo XX. Holm introdujo su procedimiento escalonado familiar (step-down family-wise) en 1979, y el artículo de Benjamini y Hochberg de 1995 sobre la tasa de descubrimiento falso transformó las pruebas a gran escala.
Debates
- Tasa de error familiar versus tasa de descubrimiento falso
- Controlar la probabilidad de cualquier rechazo falso es conservador y reduce la potencia, mientras que controlar la proporción esperada de descubrimientos falsos es más potente pero tolera algunos falsos positivos; el criterio apropiado depende del costo de los errores en la aplicación.
Key figures
- Yoav Benjamini
- Yosef Hochberg
- Sture Holm
- John W. Tukey
Related topics
Seminal works
- benjaminiHochberg1995
Frequently asked questions
- ¿Por qué no usar simplemente el nivel de significancia habitual para cada prueba?
- Porque con muchas pruebas, la probabilidad de que al menos una hipótesis nula verdadera sea rechazada crece rápidamente; por ejemplo, veinte pruebas independientes a un nivel del cinco por ciento dan aproximadamente un sesenta y cuatro por ciento de probabilidad de un falso positivo.
- ¿Es la tasa de descubrimiento falso siempre mejor que Bonferroni?
- No siempre. La tasa de descubrimiento falso ofrece más potencia con muchas pruebas, pero tolera algunos descubrimientos falsos; cuando incluso un falso positivo es costoso, se prefiere el control familiar, como Bonferroni o Holm.