Quelle est la différence entre l'évaluation normative et l'évaluation critériée ?

L'évaluation normative compare le score d'une personne à la distribution d'un échantillon de référence pour montrer son positionnement relatif, tandis que l'évaluation critériée compare la performance à une compétence ou à un standard défini, indépendamment de la performance des pairs.

Pourquoi l'erreur standard de mesure est-elle importante ?

Parce qu'aucun test n'est parfaitement fiable, un score obtenu est une estimation ; l'erreur standard de mesure quantifie son incertitude et explique pourquoi les scores sont mieux interprétés comme des intervalles de confiance plutôt que des points exacts, surtout près d'un seuil diagnostique (cut-off).

Tests standardisés et évaluation normative

Les tests standardisés et l'évaluation normative désignent l'utilisation d'instruments formels administrés et notés dans des conditions fixes, permettant de comparer la performance d'un individu à la distribution des scores obtenus à partir d'un échantillon de référence (normatif) représentatif. En orthophonie, ces outils produisent des scores standard, des rangs centiles et des équivalents d'âge, qui sont utilisés pour étayer les décisions relatives à l'éligibilité, à la sévérité et au diagnostic.

Trouver un sujet avec PaperMindBientôtFind papers & topics

Tools & resources

Télécharger les diapositives

Learn & explore

VidéoBientôt

Definition

Un test normatif est une mesure administrée et notée dans des conditions standardisées, et interprétée en comparant le score brut d'un individu à la distribution des scores d'un échantillon normatif défini, généralement exprimée sous forme de scores standard ou de rangs centiles.

Scope

Ce thème aborde la logique de la mesure normative, la signification de la standardisation, les propriétés psychométriques (fidélité, validité, adéquation normative) qui déterminent la fiabilité d'un test, ainsi que l'interprétation et les limites des critères de seuil (cut-off). Il traite des tests standardisés comme un mode d'évaluation en orthophonie et comme un sujet méthodologique, et non comme des instructions pour l'évaluation d'un individu.

Core questions

Que nous dit réellement un score standard sur un individu par rapport à ses pairs ?
Quel degré d'adéquation l'échantillon normatif, la fidélité et la validité d'un test doivent-ils atteindre avant que ses scores puissent guider un diagnostic ?
Où doit être fixé un seuil diagnostique (cut-off), et comment ce choix affecte-t-il la sensibilité et la spécificité ?
Quand l'évaluation normative est-elle un outil inapproprié, et qu'est-ce qui devrait la compléter ?

Key concepts

Standardisation de l'administration et de la notation
Échantillon normatif (de référence)
Score standard, rang centile, équivalent d'âge
Fidélité (test-retest, cohérence interne)
Validité (de construit, de contenu, de critère)
Sensibilité, spécificité et seuils diagnostiques (cut-offs)
Erreur standard de mesure
Interprétation normative versus interprétation critériée

Mechanisms

Un test est standardisé en fixant les items, la procédure d'administration et les règles de notation, puis en l'administrant à un échantillon normatif choisi pour représenter la population d'intérêt. Le score brut d'un individu est converti, en utilisant la distribution de cet échantillon, en un score standard ou un rang centile qui situe la personne par rapport à ses pairs. La valeur interprétative de cette position dépend de la fidélité du test (cohérence de la mesure), de sa validité (s'il mesure le construit visé) et de la représentativité des normes. L'utilisation diagnostique ajoute une règle de décision : un seuil (cut-off) en dessous duquel la performance est considérée comme désordonnée, dont le placement régit le compromis entre la sensibilité et la spécificité (Spaulding, Plante, & Farinella, 2006).

Clinical relevance

Les scores normatifs déterminent fréquemment l'éligibilité aux services et la sévérité documentée d'un trouble de la communication, de sorte que leur qualité psychométrique a des conséquences directes sur l'identification des individus. Cette entrée décrit comment ces scores sont dérivés et interprétés, ainsi que les conditions dans lesquelles ils sont fiables ; il s'agit d'une orientation de référence et non d'une prescription sur la manière de tester ou de diagnostiquer une personne spécifique.

Evidence & guidelines

Des revues méthodologiques ont montré à plusieurs reprises que de nombreux tests de langage et d'articulation publiés ne satisfont pas aux critères psychométriques de base en matière de fidélité, de validité et d'adéquation normative, mettant en garde contre une confiance non critique dans leurs scores (McCauley & Swisher, 1984). Les analyses des critères d'éligibilité montrent que les seuils (cut-offs) courants (par exemple, une performance d'un ou plusieurs écarts-types en dessous de la moyenne) ne distinguent pas systématiquement les enfants présentant un trouble du langage de leurs pairs au développement typique, car les tests diffèrent dans leur précision diagnostique (Spaulding et al., 2006). Les Standards for Educational and Psychological Testing (AERA, APA, & NCME, 2014) énoncent les attentes générales concernant le développement des tests, les preuves de validité et l'utilisation équitable.

History

Les tests normatifs dans les troubles de la communication se sont rapidement développés au milieu du XXe siècle, parallèlement au mouvement psychométrique plus large codifié par des figures telles qu'Anastasi. Dans les années 1980, la prolifération des tests de langage et d'articulation a suscité un examen psychométrique systématique (McCauley & Swisher, 1984), et les travaux ultérieurs ont déplacé l'accent des seuils (cut-offs) commodes vers une précision diagnostique documentée et l'intégration des scores standardisés avec d'autres preuves d'évaluation (Spaulding et al., 2006).

Debates

Une performance inférieure à un seuil (cut-off) conventionnel est-elle suffisante pour diagnostiquer un trouble ?: Les seuils diagnostiques (cut-offs) tels que -1 ou -1,25 écarts-types sont largement utilisés, mais leur sensibilité et leur spécificité varient selon les tests ; se fier à un seul seuil conventionnel peut conduire à une sur- ou sous-identification des enfants, de sorte que le seuil devrait être justifié par la précision diagnostique mesurée du test.
Dans quelle mesure les échantillons normatifs représentent-ils les populations diverses ?: Lorsqu'un échantillon normatif ne représente pas le contexte linguistique ou culturel d'une personne, les scores standard peuvent mal représenter les capacités, soulevant des questions de longue date sur l'utilisation équitable des tests normatifs à travers les populations.

Key figures

Rebecca McCauley
Linda Swisher
Elena Plante
Tammie Spaulding
Anne Anastasi

Seminal works

mccauley-swisher-1984
spaulding-2006
anastasi-urbina-1997

Frequently asked questions

Quelle est la différence entre l'évaluation normative et l'évaluation critériée ?: L'évaluation normative compare le score d'une personne à la distribution d'un échantillon de référence pour montrer son positionnement relatif, tandis que l'évaluation critériée compare la performance à une compétence ou à un standard défini, indépendamment de la performance des pairs.
Pourquoi l'erreur standard de mesure est-elle importante ?: Parce qu'aucun test n'est parfaitement fiable, un score obtenu est une estimation ; l'erreur standard de mesure quantifie son incertitude et explique pourquoi les scores sont mieux interprétés comme des intervalles de confiance plutôt que des points exacts, surtout près d'un seuil diagnostique (cut-off).