Tests psychologiques et psychométrie
La psychométrie est la science de la mesure des attributs psychologiques : elle étudie comment les tests sont construits, comment leurs scores sont quantifiés, et comment la fidélité, la validité et l'équité sont établies afin qu'un nombre dérivé d'un test puisse être interprété avec confiance.
Definition
La psychométrie est la branche de la psychologie qui s'intéresse à la théorie et à la technique de la mesure psychologique, y compris la conception, l'administration, la notation et la validation des tests, ainsi que les modèles statistiques qui relient les scores observés aux attributs sous-jacents.
Scope
Ce sujet couvre la théorie et les méthodes qui transforment les réponses en scores interprétables : la théorie classique des tests et le modèle du score vrai, la fidélité et l'erreur de mesure, le cadre de la validité, l'analyse au niveau des items, l'établissement de normes et la standardisation, ainsi que l'équité des tests. Il s'agit d'une entrée méthodologique sur la mesure, et non d'un guide sur le choix ou la notation des tests pour un individu donné.
Core questions
- Dans quelle mesure un score observé reflète-t-il l'attribut par rapport à l'erreur de mesure ?
- Quelles preuves sont nécessaires avant qu'un score puisse être interprété comme mesurant un construit visé ?
- Comment les items de test sont-ils analysés, sélectionnés et mis à l'échelle ?
- Comment les scores sont-ils rendus comparables entre les individus grâce aux normes et à la standardisation ?
Key concepts
- Score vrai et erreur de mesure
- Fidélité (cohérence interne, test-retest, inter-juges)
- Validité de contenu, de critère et de construit
- Analyse des items et difficulté/discrimination
- Normes, standardisation et scores standard
- Théorie de réponse aux items
- Invariance de mesure et équité des tests
Key theories
- Classical test theory
- La théorie classique des tests modélise un score observé comme la somme d'un score vrai et d'une erreur aléatoire, à partir de laquelle la fidélité est définie comme la proportion de la variance du score observé attribuable à la variance du score vrai ; Lord et Novick ont donné au domaine sa formulation statistique rigoureuse.
- Unified construct validity
- Cronbach et Meehl ont articulé la validité autour du construit qu'un test infère, et Messick a unifié les preuves de contenu, de critère et de construit en un seul argument concernant la justification et les conséquences de l'interprétation des scores.
Mechanisms
Dans le modèle classique, un score observé est traité comme un score vrai plus une erreur aléatoire, et la fidélité quantifie la part de variance qui est la variance du score vrai ; Lord et Novick ont formalisé cela ainsi que les modèles ultérieurs de réponse aux items. La validité est la garantie qu'un score soutient une inférence prévue : Cronbach et Meehl l'ont située dans le construit et son réseau nomologique, Haynes et ses collègues ont détaillé la validité de contenu comme la correspondance systématique des items avec le domaine cible, et Messick a unifié les types de preuves en un argument qui pèse également les conséquences de l'interprétation. Les normes et la standardisation rendent les scores comparables en les référant à une population définie.
Clinical relevance
Les propriétés psychométriques déterminent si un score de test clinique peut être fiable et ce qu'il peut signifier ; ainsi, les preuves de fidélité et de validité sous-tendent toute utilisation défendable des tests en psychologie clinique. Cette entrée explique ces propriétés en tant que concepts de mesure ; elle ne recommande pas d'instruments spécifiques ou de seuils pour une personne donnée.
Evidence & guidelines
Les Standards for Educational and Psychological Testing codifient les attentes en matière de fidélité, de validité et d'équité dans le développement et l'utilisation des tests. Cronbach et Meehl, Messick, et Haynes et ses collègues sont des références méthodologiques standard pour le cadre de la validité, et Lord et Novick est l'énoncé canonique de la théorie classique des tests et de la théorie de réponse aux items.
History
La mesure mentale a émergé des travaux du XIXe siècle sur les différences individuelles et a été systématisée sous la forme de la théorie classique des tests dans la première moitié du XXe siècle. L'article de Cronbach et Meehl de 1955 a rendu la validité de construit centrale, la monographie de Lord et Novick de 1968 a donné au domaine une base statistique rigoureuse et de réponse aux items, et la synthèse ultérieure de Messick a unifié le concept de validité autour de la justification des inférences et de leurs conséquences sociales.
Debates
- La validité est-elle une propriété des tests ou des inférences ?
- Le domaine est largement passé de la notion de tests valides à la validation des inférences et des utilisations tirées des scores, avec une discussion continue sur la mesure dans laquelle les conséquences des tests appartiennent au concept de validité.
Key figures
- Lee Cronbach
- Paul Meehl
- Samuel Messick
- Frederic Lord
- Melvin Novick
Related topics
Seminal works
- cronbach-meehl-1955
- lord-novick-1968
- messick-1995
Frequently asked questions
- Quelle est la différence entre la fidélité et la validité ?
- La fidélité est la cohérence d'une mesure (dans quelle mesure elle est peu affectée par l'erreur aléatoire), tandis que la validité est la justification de l'inférence tirée d'un score ; un test peut être fidèle sans être valide pour un objectif donné, mais il ne peut pas être valide sans être raisonnablement fidèle.
- Que signifie la validité de construit ?
- C'est le degré auquel un test peut être interprété comme mesurant un attribut visé et défini théoriquement, établi en accumulant des preuves que le test est lié à d'autres variables comme le prédit la théorie.