Investigación Reproducible
La investigación reproducible es la práctica de realizar y publicar análisis estadísticos de manera que otros, con los mismos datos y código, puedan regenerar exactamente los resultados reportados.
Definition
La investigación reproducible es un conjunto de prácticas que aseguran que los resultados computacionales de un análisis estadístico puedan ser regenerados a partir de los datos y el código originales, al vincular datos, código de análisis, entorno computacional y narrativa.
Scope
Este tema abarca la programación letrada que entrelaza código, resultados y narrativa, los documentos dinámicos y cuadernos que la implementan, el control de versiones y la captura de entornos, el intercambio de datos y código bajo principios como FAIR, y la distinción entre reproducibilidad y el objetivo más difícil de replicabilidad. El énfasis está en la reproducibilidad computacional de un análisis.
Core questions
- ¿Qué significa que un análisis computacional sea reproducible?
- ¿Cómo la programación letrada y los documentos dinámicos vinculan el código con los resultados?
- ¿Cómo el control de versiones y la captura de entornos preservan un análisis?
- ¿Cómo los principios de intercambio de datos como FAIR apoyan la reutilización y la verificación?
Key concepts
- Programación letrada
- Documentos dinámicos
- Control de versiones
- Captura de entorno
- Principios de datos FAIR
- Reproducibilidad versus replicabilidad
Key theories
- Programación letrada y documentos dinámicos
- Intercalar el código de análisis con texto explicativo y regenerar figuras y tablas directamente a partir de ese código, como en la programación letrada y los cuadernos modernos, asegura que los resultados reportados siempre coincidan con los cálculos que los produjeron.
- Datos y entornos localizables y accesibles
- Compartir datos y código bajo principios como FAIR, junto con entornos computacionales capturados e historial de versiones, permite a otros localizar, ejecutar y verificar un análisis en lugar de simplemente leer sus conclusiones.
Clinical relevance
Los flujos de trabajo reproducibles permiten a colaboradores, revisores y reguladores verificar resultados estadísticos, detectar errores y construir sobre trabajos previos; en medio de la preocupación por una crisis de reproducibilidad en todas las ciencias, estas prácticas son una salvaguarda práctica para la credibilidad de los análisis de datos.
History
Claerbout fue pionero en documentos computacionales reproducibles en geofísica, la programación letrada de Knuth proporcionó la idea subyacente, y estadísticos como Gentleman formalizaron el análisis reproducible; las herramientas de documentos dinámicos y los principios FAIR hicieron que estas prácticas se generalizaran posteriormente.
Debates
- Reproducibilidad versus replicabilidad
- Regenerar los mismos resultados a partir de los mismos datos y código (reproducibilidad) es distinto de obtener hallazgos consistentes en un nuevo estudio (replicabilidad); existe una discusión continua sobre la terminología y sobre cuánto garantiza cada uno la validez científica.
Key figures
- Donald Knuth
- Robert Gentleman
- Duncan Temple Lang
- Jon Claerbout
Related topics
Seminal works
- knuth1984
- gentleman2007
Frequently asked questions
- ¿Es la reproducibilidad lo mismo que obtener la misma conclusión científica en un nuevo experimento?
- No. La reproducibilidad significa regenerar los mismos resultados a partir de los mismos datos y código. Obtener un hallazgo consistente en un nuevo estudio con nuevos datos es replicabilidad, un estándar separado y generalmente más difícil.
- ¿Qué herramientas apoyan la investigación reproducible?
- Los sistemas de documentos dinámicos y los cuadernos que ejecutan código para producir figuras y tablas, el control de versiones para rastrear cambios y las herramientas de captura de entorno que registran las versiones de software, en conjunto, hacen que un análisis sea reproducible por otros.