Datos Faltantes y Abandono
Los datos faltantes son valores que se pretendía recopilar pero que no se obtuvieron, y el abandono es la pérdida de participantes a lo largo de un estudio, a menudo por deserción o pérdida de seguimiento. Ambos reducen la información disponible y, lo que es más grave, pueden sesgar los resultados cuando la probabilidad de que un valor falte está relacionada con lo que ese valor habría sido. Anticipar y limitar la falta de datos en la etapa de diseño, y manejarlos adecuadamente en el análisis, son esenciales para preservar la validez de un estudio.
Definition
Los datos faltantes son observaciones previstas que no se registraron, y el abandono es la pérdida de participantes inscritos durante un estudio; su impacto depende del mecanismo de los datos faltantes, que va desde faltantes completamente al azar (no relacionados con ningún dato) hasta faltantes al azar (explicables por datos observados) y faltantes no al azar (relacionados con el valor no observado en sí).
Scope
La entrada cubre los tipos de datos faltantes (faltantes completamente al azar, al azar y no al azar), las consecuencias del abandono para el sesgo y la potencia, las estrategias de prevención incorporadas en el diseño y la realización, y los métodos de manejo basados en principios, como la imputación múltiple y el enfoque de intención de tratar. Se enmarca como una referencia metodológica y no proporciona instrucciones clínicas.
Key concepts
- Faltantes completamente al azar (MCAR)
- Faltantes al azar (MAR)
- Faltantes no al azar (MNAR)
- Pérdida de seguimiento y abandono
- Imputación múltiple
- Análisis por intención de tratar
- Análisis de casos completos y sus sesgos
- Análisis de sensibilidad para suposiciones de datos faltantes
Mechanisms
La amenaza de los datos faltantes depende de por qué faltan los valores. Si la falta de datos no está relacionada con ningún dato (MCAR), los análisis simples pierden precisión pero siguen siendo imparciales; si puede explicarse completamente por variables observadas (MAR), métodos como la imputación múltiple pueden recuperar estimaciones válidas modelando los valores faltantes a partir de los observados; si depende del valor no observado en sí (MNAR), ningún método puede garantizar un resultado imparcial y las conclusiones dependen de suposiciones no comprobables. El abandono que está relacionado con el tratamiento o el pronóstico puede romper el equilibrio creado por la aleatorización, razón por la cual el análisis por intención de tratar mantiene a los participantes en sus grupos asignados y por qué se enfatiza la prevención, en lugar de la reparación posterior. Los análisis de sensibilidad examinan cómo cambian las conclusiones bajo diferentes suposiciones sobre la falta de datos.
Clinical relevance
Evaluar cuánto faltaba, por qué y cómo se manejó es parte de juzgar si los resultados de un estudio son confiables, porque un abandono alto o diferencial puede exagerar o enmascarar un efecto. Esta entrada describe la metodología de investigación para la evaluación y no es una fuente de orientación diagnóstica o de tratamiento.
Evidence & guidelines
Un panel de expertos convocado para la Administración de Alimentos y Medicamentos de EE. UU. enfatizó la prevención de datos faltantes a través del diseño y la realización de ensayos y advirtió contra la dependencia de una única solución analítica. La guía metodológica describe la imputación múltiple bajo la suposición de datos faltantes al azar y sus inconvenientes, y el marco de intención de tratar para ensayos con resultados faltantes; los estándares de informes como CONSORT requieren un diagrama de flujo de participantes que documente las pérdidas. Las encuestas muestran que la intención de tratar a menudo se define y aplica de manera inconsistente en la práctica.
History
El marco moderno fue moldeado por la formalización de Rubin en la década de 1970 de los mecanismos de los datos faltantes y por el trabajo posterior de Little y Rubin sobre el análisis estadístico con datos faltantes, que introdujo la imputación múltiple. A medida que los ensayos aleatorizados maduraron, el principio de intención de tratar se volvió central para manejar el abandono sin romper la aleatorización. Un informe del Consejo Nacional de Investigación de EE. UU. de 2010 y el panel asociado encargado por la FDA posteriormente replantearon los datos faltantes como un problema principalmente de prevención por diseño en lugar de corrección estadística post hoc.
Debates
- ¿Puede la imputación múltiple rescatar un estudio con datos faltantes sustanciales?
- La imputación múltiple proporciona una inferencia válida cuando los datos faltan al azar, pero su validez se basa en una suposición que no se puede verificar a partir de los datos; cuando los datos faltan no al azar, puede inducir a error, por lo que es una herramienta que debe usarse con análisis de sensibilidad en lugar de una solución garantizada.
- ¿Cómo debe manejar la intención de tratar los resultados faltantes?
- La intención de tratar mantiene a los participantes en sus grupos aleatorizados para preservar el equilibrio, pero cuando faltan los resultados no se puede aplicar sin suposiciones sobre los valores faltantes; cómo combinar el principio con la imputación y el análisis de sensibilidad sigue siendo un desafío práctico.
Key figures
- Roderick Little
- Donald Rubin
- Ian White
- Jonathan Sterne
- Douglas Altman
Related topics
Seminal works
- little-2012-prevention
- sterne-2009-mi
- white-2011-itt
Frequently asked questions
- ¿Por qué la razón por la que faltan datos es más importante que la cantidad que falta?
- Incluso una cantidad modesta de datos faltantes puede sesgar los resultados si la probabilidad de que falten depende del valor no observado, mientras que los datos faltantes por razones no relacionadas con el valor principalmente cuestan precisión; el mecanismo, no solo la cantidad, determina si y cuánto sesgo surge.
- ¿Qué es el análisis por intención de tratar y por qué es importante para el abandono?
- La intención de tratar analiza a los participantes en los grupos a los que fueron aleatorizados, independientemente de lo que sucedió después, lo que preserva el equilibrio creado por la aleatorización; es importante para el abandono porque excluir a los desertores o analizar solo a aquellos que completaron el tratamiento puede reintroducir la confusión que la aleatorización eliminó.