Prueba de Hipótesis Estadística
La prueba de hipótesis es la teoría de decidir entre afirmaciones contrapuestas sobre una población a partir de datos, controlando la probabilidad de cada tipo de error.
Definition
Una prueba de hipótesis estadística es una regla que utiliza datos de muestra para decidir si se rechaza una hipótesis nula a favor de una alternativa, diseñada de modo que la probabilidad de rechazar erróneamente una nula verdadera esté limitada por un nivel de significancia elegido.
Scope
Esta área abarca la formulación de hipótesis nulas y alternativas, los dos tipos de error y el tamaño y la potencia de una prueba, el lema de Neyman-Pearson para la prueba más potente de hipótesis simples, la razón de verosimilitud monótona y las pruebas uniformemente más potentes, las pruebas insesgadas e invariantes, la prueba de razón de verosimilitud y su distribución chi-cuadrado para muestras grandes, los valores p y su interpretación, y el problema de probar muchas hipótesis a la vez.
Sub-topics
Core questions
- ¿Cómo se definen el tamaño y la potencia de una prueba, y cómo se compensan los dos tipos de error?
- ¿Qué prueba es la más potente para decidir entre dos hipótesis simples?
- ¿Cuándo existe una prueba uniformemente más potente para una alternativa unilateral?
- ¿Cómo se debe controlar la significancia cuando se prueban muchas hipótesis simultáneamente?
Key theories
- Lema de Neyman-Pearson
- Entre todas las pruebas de un tamaño dado para dos hipótesis simples, la prueba de razón de verosimilitud que rechaza cuando la razón excede un umbral es la más potente.
- Pruebas uniformemente más potentes e insesgadas
- Para familias con razón de verosimilitud monótona, una única prueba es la más potente contra cada alternativa en un lado; cuando no existe tal prueba, se busca la optimización dentro de las clases insesgadas o invariantes.
- Pruebas de razón de verosimilitud
- El estadístico de razón de verosimilitud generalizada compara las verosimilitudes maximizadas bajo la hipótesis nula y el modelo completo; bajo regularidad, su logaritmo es asintóticamente chi-cuadrado, lo que proporciona una prueba de propósito general.
Clinical relevance
Las pruebas de hipótesis sustentan la evaluación de ensayos clínicos, pruebas A/B, control de calidad y detección de señales, donde el control de las tasas de falsos positivos y la garantía de una potencia adecuada afectan directamente qué intervenciones, productos o descubrimientos se aceptan como reales.
History
Fisher desarrolló las pruebas de significancia y los valores p en la década de 1920. Neyman y Pearson introdujeron el marco teórico de decisión de dos hipótesis, errores y potencia en 1933, y el trabajo de Lehmann a mediados de siglo, continuado con Romano, organizó la teoría de la optimización de las pruebas.
Debates
- Significancia fisheriana versus decisiones de Neyman-Pearson
- Fisher consideraba el valor p como una medida continua de evidencia contra la hipótesis nula, mientras que Neyman y Pearson enmarcaron las pruebas como una decisión con tasas de error fijas; las dos filosofías a menudo se mezclan en la práctica y la diferencia sigue siendo objeto de debate.
Key figures
- Jerzy Neyman
- Egon Pearson
- Ronald A. Fisher
- Erich L. Lehmann
Related topics
Seminal works
- lehmannRomano2005
Frequently asked questions
- ¿Cuál es la diferencia entre un error de Tipo I y un error de Tipo II?
- Un error de Tipo I rechaza una hipótesis nula verdadera, un falso positivo; un error de Tipo II no rechaza una hipótesis nula falsa, un falso negativo. El nivel de significancia limita el primero y la potencia es igual a uno menos la probabilidad del segundo.
- ¿Un valor p pequeño prueba la hipótesis alternativa?
- No. Un valor p pequeño indica que los datos serían poco probables bajo la hipótesis nula; es evidencia en contra de la nula, no una probabilidad de que la nula sea falsa, y no establece por sí mismo la importancia práctica.