Pourquoi la raison pour laquelle les données sont manquantes est-elle plus importante que la quantité de données manquantes ?

Même une quantité modeste de données manquantes peut biaiser les résultats si la probabilité d'être manquant dépend de la valeur non observée, tandis que les données manquantes pour des raisons sans rapport avec la valeur coûtent principalement en précision ; c'est le mécanisme, et non seulement la quantité, qui détermine si et dans quelle mesure un biais apparaît.

Qu'est-ce que l'analyse en intention de traiter et pourquoi est-elle importante pour l'attrition ?

L'intention de traiter analyse les participants dans les groupes auxquels ils ont été randomisés, indépendamment de ce qui s'est passé par la suite, ce qui préserve l'équilibre créé par la randomisation ; elle est importante pour l'attrition car exclure les abandons ou analyser uniquement ceux qui ont terminé le traitement peut réintroduire le facteur de confusion que la randomisation avait éliminé.

Données manquantes et attrition

Les données manquantes désignent des valeurs qui devaient être recueillies mais qui n'ont pas été obtenues, tandis que l'attrition correspond à la perte de participants au cours d'une étude, souvent par abandon ou par perte de suivi. Ces deux phénomènes réduisent l'information disponible et, plus grave encore, peuvent biaiser les résultats lorsque la probabilité qu'une valeur soit manquante est liée à ce que cette valeur aurait été. Anticiper et limiter les données manquantes dès la phase de conception, et les gérer de manière appropriée lors de l'analyse, sont essentiels pour préserver la validité d'une étude.

Trouver un sujet avec PaperMindBientôtFind papers & topics

Tools & resources

Télécharger les diapositives

Learn & explore

VidéoBientôt

Definition

Les données manquantes sont des observations prévues qui n'ont pas été enregistrées, et l'attrition est la perte de participants recrutés au cours d'une étude ; leur impact dépend du mécanisme des données manquantes, allant de manquantes complètement au hasard (sans rapport avec aucune donnée), en passant par manquantes au hasard (explicables par les données observées), jusqu'à manquantes non au hasard (liées à la valeur non observée elle-même).

Scope

Cette entrée couvre les types de données manquantes (manquantes complètement au hasard, manquantes au hasard et manquantes non au hasard), les conséquences de l'attrition sur le biais et la puissance statistique, les stratégies de prévention intégrées à la conception et à la conduite de l'étude, ainsi que les méthodes de gestion rigoureuses telles que l'imputation multiple et l'approche en intention de traiter. Elle est conçue comme une référence méthodologique et ne fournit pas d'instructions cliniques.

Key concepts

Manquantes complètement au hasard (MCAR)
Manquantes au hasard (MAR)
Manquantes non au hasard (MNAR)
Perte de suivi et abandon
Imputation multiple
Analyse en intention de traiter
Analyse des cas complets et ses biais
Analyse de sensibilité pour les hypothèses de données manquantes

Mechanisms

La menace que représentent les données manquantes dépend de la raison pour laquelle les valeurs sont absentes. Si les données manquantes sont sans rapport avec aucune donnée (MCAR), les analyses simples perdent en précision mais demeurent non biaisées ; si elles peuvent être entièrement expliquées par des variables observées (MAR), des méthodes telles que l'imputation multiple peuvent permettre d'obtenir des estimations valides en modélisant les valeurs manquantes à partir des valeurs observées ; si elles dépendent de la valeur non observée elle-même (MNAR), aucune méthode ne peut garantir un résultat non biaisé et les conclusions reposent sur des hypothèses invérifiables. L'attrition liée au traitement ou au pronostic peut rompre l'équilibre créé par la randomisation, c'est pourquoi l'analyse en intention de traiter maintient les participants dans leurs groupes assignés et pourquoi la prévention, plutôt que la correction a posteriori, est privilégiée. Les analyses de sensibilité examinent comment les conclusions évoluent sous différentes hypothèses concernant les données manquantes.

Clinical relevance

Évaluer la quantité de données manquantes, leur origine et leur gestion est essentiel pour juger de la fiabilité des résultats d'une étude, car une attrition élevée ou différentielle peut exagérer ou masquer un effet. Cette entrée décrit la méthodologie de recherche pour l'évaluation et ne constitue pas une source de conseils diagnostiques ou thérapeutiques.

Evidence & guidelines

Un panel d'experts réuni pour la Food and Drug Administration (FDA) des États-Unis a souligné l'importance de prévenir les données manquantes par la conception et la conduite des essais, et a mis en garde contre le recours à une solution analytique unique. Les directives méthodologiques décrivent l'imputation multiple sous l'hypothèse de données manquantes au hasard et ses écueils, ainsi que le cadre de l'intention de traiter pour les essais avec des résultats manquants ; les normes de rapport telles que CONSORT exigent un diagramme de flux des participants documentant les pertes. Des enquêtes montrent que l'intention de traiter est souvent définie et appliquée de manière incohérente dans la pratique.

History

Le cadre moderne a été façonné par la formalisation des mécanismes de données manquantes par Rubin dans les années 1970 et par les travaux ultérieurs de Little et Rubin sur l'analyse statistique avec des données manquantes, qui ont introduit l'imputation multiple. À mesure que les essais randomisés ont mûri, le principe de l'intention de traiter est devenu central pour gérer les abandons sans rompre la randomisation. Un rapport de 2010 du U.S. National Research Council et le panel associé mandaté par la FDA ont par la suite recadré les données manquantes comme étant principalement un problème de prévention par la conception plutôt que de correction statistique a posteriori.

Debates

L'imputation multiple peut-elle sauver une étude avec des données manquantes substantielles ?: L'imputation multiple permet une inférence valide lorsque les données sont manquantes au hasard, mais sa validité repose sur une hypothèse qui ne peut être vérifiée à partir des données ; lorsque les données sont manquantes non au hasard, elle peut induire en erreur, c'est pourquoi elle doit être utilisée avec une analyse de sensibilité plutôt que comme une solution garantie.
Comment l'intention de traiter doit-elle gérer les résultats manquants ?: L'intention de traiter maintient les participants dans leurs groupes randomisés pour préserver l'équilibre, mais lorsque les résultats sont manquants, elle ne peut être appliquée sans faire d'hypothèses sur les valeurs manquantes ; la manière de combiner ce principe avec l'imputation et l'analyse de sensibilité reste un défi pratique.

Key figures

Roderick Little
Donald Rubin
Ian White
Jonathan Sterne
Douglas Altman

Seminal works

little-2012-prevention
sterne-2009-mi
white-2011-itt

Frequently asked questions

Pourquoi la raison pour laquelle les données sont manquantes est-elle plus importante que la quantité de données manquantes ?: Même une quantité modeste de données manquantes peut biaiser les résultats si la probabilité d'être manquant dépend de la valeur non observée, tandis que les données manquantes pour des raisons sans rapport avec la valeur coûtent principalement en précision ; c'est le mécanisme, et non seulement la quantité, qui détermine si et dans quelle mesure un biais apparaît.
Qu'est-ce que l'analyse en intention de traiter et pourquoi est-elle importante pour l'attrition ?: L'intention de traiter analyse les participants dans les groupes auxquels ils ont été randomisés, indépendamment de ce qui s'est passé par la suite, ce qui préserve l'équilibre créé par la randomisation ; elle est importante pour l'attrition car exclure les abandons ou analyser uniquement ceux qui ont terminé le traitement peut réintroduire le facteur de confusion que la randomisation avait éliminé.