Métodos de remuestreo
Los métodos de remuestreo evalúan la incertidumbre de una estadística extrayendo repetidamente nuevas muestras de los datos observados, reemplazando las fórmulas analíticas para los errores estándar y las distribuciones con el cálculo.
Definition
Los métodos de remuestreo son técnicas inferenciales intensivas en computación que estiman la distribución muestral, el sesgo, la varianza o el error predictivo de una estadística, recalculándola repetidamente en muestras extraídas de, o particiones de, los datos observados.
Scope
Esta área cubre el bootstrap y sus intervalos de confianza, el jackknife para la estimación de sesgos y varianzas, las pruebas de permutación y aleatorización para la prueba de hipótesis, y la validación cruzada para estimar el error predictivo. La idea unificadora es que la distribución empírica de los datos, reutilizada a través del remuestreo, sustituye a una distribución poblacional desconocida.
Sub-topics
Core questions
- ¿Cómo puede el remuestreo repetido de los datos observados aproximar la distribución muestral de una estadística?
- ¿Qué distingue al bootstrap, al jackknife, a las pruebas de permutación y a la validación cruzada en cuanto a su objetivo y mecanismo?
- ¿Cuándo tienen éxito las aproximaciones de remuestreo y cuándo fallan?
- ¿Cómo se utilizan los métodos de remuestreo para construir intervalos de confianza y pruebas sin suposiciones paramétricas?
Key theories
- El principio plug-in
- El remuestreo reemplaza la distribución poblacional desconocida con la distribución empírica de la muestra, de modo que las cantidades como los errores estándar y los sesgos se calculan mediante el muestreo repetido de los propios datos.
- Remuestreo para inferencia
- El remuestreo bootstrap estima la variabilidad y los intervalos de confianza, el remuestreo de permutación genera distribuciones nulas exactas o aproximadas, y la validación cruzada reutiliza particiones de los datos para estimar el error fuera de la muestra.
Clinical relevance
Los métodos de remuestreo proporcionan errores estándar, intervalos de confianza y pruebas para estadísticas complicadas donde no existe una fórmula manejable, y ofrecen estimaciones honestas de la precisión predictiva para modelos estadísticos y de aprendizaje automático; sus suposiciones mínimas los hacen omnipresentes en las ciencias empíricas.
History
Quenouille y Tukey desarrollaron el jackknife en las décadas de 1940 y 1950; Efron introdujo el bootstrap en 1979 y lo unificó con el jackknife, y el auge de la computación económica durante las décadas de 1980 y 1990 convirtió el remuestreo en una alternativa principal a la teoría asintótica.
Key figures
- Bradley Efron
- Robert Tibshirani
- Anthony Davison
- Maurice Quenouille
Related topics
Seminal works
- efron1993
- efron1979
Frequently asked questions
- ¿Por qué se denominan intensivos en computación los métodos de remuestreo?
- Reemplazan las derivaciones de forma cerrada con miles de recálculos repetidos de una estadística sobre datos remuestreados. Esto solo es práctico con una computadora, pero a cambio los métodos requieren muchas menos suposiciones de modelado.
- ¿Funcionan siempre los métodos de remuestreo?
- No. Pueden fallar para estadísticas que dependen de estadísticas de orden extremo, para muestras muy pequeñas o bajo una fuerte dependencia. Conocer estos modos de fallo es parte del uso responsable de los métodos.