Validité et fiabilité des mesures
La validité et la fiabilité sont les deux propriétés fondamentales qui déterminent si une mesure de qualité peut être considérée comme fiable. La validité se rapporte à la capacité d'une mesure à réellement saisir l'aspect de la qualité qu'elle prétend évaluer ; la fiabilité concerne la capacité de la mesure à produire des résultats cohérents lorsqu'elle est appliquée de manière répétée dans les mêmes conditions. Une mesure doit être à la fois fiable et valide avant que ses résultats ne puissent justifier des jugements sur la qualité ou des décisions d'action.
Definition
La fiabilité est le degré auquel une mesure produit des résultats cohérents et reproductibles à travers des applications répétées, des évaluateurs (raters) ou des items ; la validité est le degré auquel une mesure reflète fidèlement le construit sous-jacent, ici un aspect de la qualité des soins de santé, qu'elle est censée évaluer.
Scope
Cette entrée aborde les principales formes de validité et de fiabilité telles qu'elles s'appliquent aux indicateurs et instruments de qualité, les statistiques couramment utilisées pour les quantifier, et pourquoi ces deux propriétés sont essentielles pour toute mesure ayant des implications significatives. Il s'agit d'une référence méthodologique et ne fournit pas de seuils de score clinique pour un instrument spécifique.
Core questions
- Que signifie pour une mesure de qualité d'être valide, et comment la validité est-elle évaluée ?
- Comment la fiabilité se distingue-t-elle de la validité, et pourquoi les deux sont-elles nécessaires ?
- Quelles statistiques quantifient la cohérence interne et l'accord inter-évaluateurs ?
- Comment une validité ou une fiabilité insuffisantes peuvent-elles induire en erreur les jugements sur la qualité ?
Key concepts
- Validité de contenu
- Validité de construit
- Validité de critère
- Cohérence interne (alpha de Cronbach)
- Fiabilité inter-évaluateurs (kappa de Cohen)
- Fiabilité test-retest
- Erreur de mesure et variation aléatoire
Key theories
- Théorie classique des tests de fiabilité
- La théorie classique des tests conçoit une mesure observée comme la somme d'une valeur vraie et d'une erreur aléatoire ; la fiabilité est donc la proportion de la variance observée attribuable aux différences réelles plutôt qu'à l'erreur. Le coefficient alpha de Cronbach opérationnalise une forme de cela comme la cohérence interne entre les items destinés à mesurer le même construit.
Mechanisms
La fiabilité est évaluée en examinant la cohérence de la mesure à travers les répétitions : la cohérence interne entre les items, l'accord entre les évaluateurs, et la stabilité dans le temps lorsque l'état sous-jacent n'a pas changé. L'alpha de Cronbach résume la cohérence interne pour les échelles multi-items, tandis que le kappa de Cohen quantifie l'accord entre deux évaluateurs sur des jugements catégoriels, en corrigeant l'accord dû au hasard. La validité est évaluée en accumulant des preuves que la mesure reflète le construit qu'elle est censée évaluer : la validité de contenu (couverture exhaustive du concept), la validité de construit (relations attendues avec d'autres mesures), et la validité de critère (accord avec un étalon de référence). Une mesure peut être fiable mais non valide, mesurant de manière cohérente la mauvaise chose, mais elle ne peut être valide sans être fiable, car l'erreur aléatoire limite la capacité d'une mesure à suivre sa cible.
Clinical relevance
Avant qu'un indicateur de qualité ou un instrument rapporté par le patient ne soit utilisé pour le reporting, l'accréditation ou les incitations, sa validité et sa fiabilité doivent être établies afin que les différences observées reflètent une variation réelle de la qualité plutôt qu'un bruit de mesure. Ces propriétés sont essentielles à l'interprétation de tout programme de mesure de la qualité. Cette entrée explique les propriétés de mesure et n'est pas une source de règles de notation clinique pour les patients individuels.
Evidence & guidelines
Les fondements statistiques proviennent du coefficient alpha de Cronbach et du kappa de Cohen, avec des directives appliquées pour la mesure en santé consolidées dans le texte de Streiner et Norman. Les directives de classification des indicateurs situent ces propriétés dans le cadre de la mesure de la qualité. Ces sources sont citées pour leur contenu méthodologique et ne sont pas des directives cliniques.
History
Les concepts de validité et de fiabilité ont été formalisés en psychométrie au milieu du XXe siècle, l'alpha de Cronbach (1951) et le kappa de Cohen (1960) devenant des outils standards. À mesure que les soins de santé ont adopté les instruments rapportés par les patients et les indicateurs de qualité, ces principes psychométriques ont été intégrés à la mesure en santé et codifiés dans des guides pratiques tels que celui de Streiner et Norman.
Debates
- L'alpha de Cronbach est-il une mesure suffisante de la fiabilité ?
- L'alpha est largement rapporté mais dépend du nombre d'items et suppose une dimension sous-jacente unique ; un alpha élevé peut refléter une redondance plutôt qu'une bonne mesure, et il n'établit ni l'unidimensionnalité ni la validité, ce qui incite à rechercher des preuves complémentaires.
Key figures
- Lee Cronbach
- Jacob Cohen
- David Streiner
- Geoffrey Norman
Related topics
Seminal works
- cronbach-1951
- cohen-1960
- streiner-norman-2015
Frequently asked questions
- Une mesure peut-elle être fiable mais non valide ?
- Oui. Une mesure peut donner des résultats très cohérents tout en saisissant de manière constante la mauvaise chose. La fiabilité est nécessaire à la validité mais ne la garantit pas ; une mesure doit également démontrer qu'elle reflète le construit qu'elle prétend évaluer.
- Pourquoi corriger le hasard lors de l'évaluation de l'accord inter-évaluateurs ?
- Deux évaluateurs s'accorderont parfois purement par hasard, surtout avec peu de catégories. Le kappa de Cohen ajuste l'accord observé en fonction de l'accord attendu par hasard, offrant une estimation plus juste de la fiabilité réelle.