Évaluation du risque de biais
L'évaluation du risque de biais est une analyse structurée de la probabilité que la conception, la conduite et la présentation des résultats d'une étude aient faussé ses résultats par rapport à la vérité. Contrairement à une hiérarchie des preuves, qui classe les types d'études en général, elle évalue une étude individuelle, en se demandant si des caractéristiques telles que la manière dont les participants ont été assignés, mis en aveugle, retenus et analysés auraient pu biaiser l'effet estimé.
Definition
L'évaluation du risque de biais est une évaluation par domaine de la validité interne d'une étude individuelle, jugeant pour chaque domaine pertinent si des lacunes dans la conception, la conduite ou la présentation des résultats sont susceptibles d'avoir produit une erreur systématique dans l'effet estimé.
Scope
Cette entrée couvre le concept de biais en tant qu'erreur systématique, les domaines standards évalués dans les études randomisées et non randomisées, ainsi que les principaux outils Cochrane utilisés pour ces jugements. Il s'agit d'une référence méthodologique sur l'évaluation au niveau de l'étude, et non d'une directive clinique.
Key concepts
- Biais en tant qu'erreur systématique (non aléatoire)
- Validité interne
- Biais de sélection / randomisation et dissimulation de l'assignation
- Biais de performance et de détection / aveuglement
- Biais d'attrition / données de résultats incomplètes
- Biais de publication / rapport sélectif des résultats
- Jugement par domaine (faible / préoccupant ou incertain / risque élevé)
- Facteurs de confusion (confounding) dans les études non randomisées
Mechanisms
L'évaluation se déroule par domaines, chacun identifiant une voie par laquelle une erreur systématique peut s'introduire. Dans les essais randomisés, ceux-ci incluent le processus de randomisation, les écarts par rapport aux interventions prévues, les données de résultats manquantes, la mesure du résultat et la sélection du résultat rapporté ; pour chacun, un évaluateur juge le risque comme faible, préoccupant (ou incertain), ou élevé, souvent guidé par des questions signalétiques, et parvient à un jugement global. Les études d'interventions non randomisées ajoutent la confusion (confounding) et la sélection des participants comme domaines centraux, car sans randomisation, ce sont les menaces dominantes. Le produit est une évaluation transparente et reproductible qui alimente la synthèse des preuves et l'évaluation de la certitude, plutôt qu'un score récapitulatif unique.
Clinical relevance
Les jugements sur le risque de biais expliquent pourquoi deux études portant sur la même question peuvent être pondérées différemment et pourquoi un ensemble de preuves peut être déclassé en raison des limites des études. Ils aident les lecteurs à déterminer si un résultat est susceptible de refléter un effet réel ou un artefact lié à la manière dont l'étude a été menée ; cette entrée décrit la méthodologie d'évaluation et ne constitue pas une base pour les décisions cliniques individuelles.
Evidence & guidelines
L'outil Cochrane d'évaluation du risque de biais (Higgins et al., 2011) a standardisé l'évaluation par domaine des essais randomisés et a été remplacé par RoB 2 (Sterne et al., 2019), qui a restructuré les domaines et ajouté des questions signalétiques. ROBINS-I (Sterne et al., 2016) a étendu l'approche aux études d'interventions non randomisées, mettant l'accent sur la confusion (confounding) et la sélection. Dans GRADE, le risque de biais au niveau de l'étude est le premier facteur susceptible de réduire la certitude d'un ensemble de preuves (Guyatt et al., 2008).
History
L'évaluation de la qualité des essais dans les années 1980 et 1990 reposait sur des échelles numériques dont les composantes et les pondérations variaient considérablement. La Collaboration Cochrane a orienté l'évaluation vers un jugement explicite, basé sur les domaines, avec son outil d'évaluation du risque de biais de 2011, privilégiant la transparence par rapport aux scores récapitulatifs. RoB 2 (2019) a affiné les domaines des essais randomisés et introduit des questions signalétiques, tandis que ROBINS-I (2016) a apporté un cadre parallèle, centré sur la confusion (confounding), aux études non randomisées.
Debates
- Jugement par domaine versus scores de qualité numériques
- Les scores de qualité composites peuvent masquer quelles lacunes spécifiques sont importantes et dans quelle mesure, de sorte que les outils modernes privilégient les jugements transparents par domaine ; les critiques notent que les jugements par domaine nécessitent toujours des décisions subjectives et peuvent varier entre les évaluateurs.
Key figures
- Julian Higgins
- Jonathan Sterne
- Douglas Altman
- Miguel Hernan
Related topics
Seminal works
- higgins-2011-robtool
- sterne-2019-rob2
- sterne-2016-robinsi
Frequently asked questions
- En quoi le risque de biais diffère-t-il de la hiérarchie des preuves ?
- La hiérarchie classe les types d'études en général selon leur vulnérabilité typique aux biais, tandis qu'une évaluation du risque de biais évalue la qualité de la conduite d'une étude spécifique, ainsi, une conception d'étude bien classée peut toujours présenter un risque de biais élevé.
- Pourquoi les scores de qualité numériques sont-ils tombés en désuétude ?
- Les scores composites combinent des caractéristiques non liées en un seul chiffre et masquent les lacunes qui influencent le résultat ; les outils basés sur les domaines, en revanche, émettent un jugement distinct et transparent pour chaque source potentielle de biais.