Bootstrap y remuestreo
El bootstrap estima la distribución muestral de un estadístico remuestreando los datos observados, reemplazando fórmulas intratables con computación.
Definition
El bootstrap es un método de remuestreo que aproxima la distribución muestral de un estadístico tratando la muestra observada como la población y extrayendo repetidamente muestras de ella, generalmente con reemplazo, para estimar errores estándar, intervalos de confianza y sesgo.
Scope
Este tema cubre el bootstrap no paramétrico mediante remuestreo con reemplazo, el bootstrap paramétrico, el jackknife y sus estimaciones de sesgo y varianza, las pruebas de permutación, los errores estándar del bootstrap y los intervalos de confianza de percentiles, corregidos por sesgo y bootstrap-t, la consistencia del bootstrap y su precisión de orden superior a través de expansiones de Edgeworth, y casos conocidos como el máximo de la muestra donde el bootstrap ordinario falla.
Core questions
- ¿Cómo el remuestreo de los datos aproxima la distribución muestral de un estadístico?
- ¿Cómo se construyen los intervalos de confianza bootstrap y en qué se diferencian los intervalos de percentiles y bootstrap-t?
- ¿Cuándo es consistente el bootstrap y cuándo falla?
- ¿Cómo utiliza una prueba de permutación el remuestreo para obtener una prueba exacta libre de distribución?
Key theories
- El principio bootstrap
- Aproximar la población desconocida mediante la distribución empírica y remuestrear a partir de ella permite estimar la variabilidad muestral de casi cualquier estadístico mediante simulación, incluso cuando no existe una distribución de forma cerrada.
- Consistencia y precisión del bootstrap
- Para estadísticos suaves, el bootstrap es consistente y, a través de expansiones de Edgeworth, ciertos intervalos bootstrap son más precisos que la aproximación normal; para funcionales no suaves como el máximo, puede fallar.
Clinical relevance
El bootstrap proporciona errores estándar e intervalos de confianza para estimadores complejos, como medianas, correlaciones y predicciones de aprendizaje automático, donde las fórmulas analíticas no están disponibles, y las pruebas de permutación ofrecen evaluaciones de significación exactas ampliamente utilizadas en genómica y experimentos aleatorizados.
History
Quenouille y Tukey desarrollaron el jackknife en la década de 1950. Efron introdujo el bootstrap en 1979, unificando y extendiendo estas ideas de remuestreo, y el trabajo de Hall en las décadas de 1980 y 1990 estableció su precisión de orden superior a través de expansiones de Edgeworth.
Key figures
- Bradley Efron
- Robert Tibshirani
- Peter Hall
- Maurice Quenouille
Related topics
Seminal works
- efron1979
Frequently asked questions
- ¿El bootstrap crea nueva información de la nada?
- No. Reutiliza la información ya presente en la muestra para aproximar la variabilidad muestral; no puede mejorar una muestra deficiente o sesgada, y su precisión depende de que la muestra original represente bien a la población.
- ¿Cuándo falla el bootstrap?
- Puede fallar para estadísticos que dependen de forma no suave de la distribución, como el máximo de la muestra o los parámetros en un límite; en tales casos, se utilizan esquemas modificados como el submuestreo o el bootstrap m-de-n.