Pruebas psicológicas y psicometría
La psicometría es la ciencia de la medición de atributos psicológicos: cómo se construyen las pruebas, cómo se cuantifican sus puntuaciones y cómo se establecen la fiabilidad, la validez y la equidad para que un número derivado de una prueba pueda interpretarse con confianza.
Definition
La psicometría es la rama de la psicología que se ocupa de la teoría y la técnica de la medición psicológica, incluyendo el diseño, la administración, la puntuación y la validación de pruebas, así como los modelos estadísticos que relacionan las puntuaciones observadas con los atributos subyacentes.
Scope
Este tema abarca la teoría y los métodos que convierten las respuestas en puntuaciones interpretables: la teoría clásica de los tests y el modelo de puntuación verdadera, la fiabilidad y el error de medición, el marco de validez, el análisis a nivel de ítem, la normalización y estandarización, y la equidad de las pruebas. Es una entrada metodológica sobre la medición, no una guía para elegir o puntuar pruebas para un individuo.
Core questions
- ¿Cuánto de una puntuación observada refleja el atributo frente al error de medición?
- ¿Qué evidencia se necesita antes de que una puntuación pueda interpretarse como la medición de un constructo previsto?
- ¿Cómo se analizan, seleccionan y escalan los ítems de una prueba?
- ¿Cómo se hacen comparables las puntuaciones entre personas mediante normas y estandarización?
Key concepts
- Puntuación verdadera y error de medición
- Fiabilidad (consistencia interna, test-retest, inter-evaluador)
- Validez de contenido, de criterio y de constructo
- Análisis de ítems y dificultad/discriminación
- Normas, estandarización y puntuaciones estándar
- Teoría de respuesta al ítem
- Invarianza de la medición y equidad de las pruebas
Key theories
- Teoría clásica de los tests
- La teoría clásica de los tests modela una puntuación observada como la suma de una puntuación verdadera y un error aleatorio, a partir de lo cual la fiabilidad se define como la proporción de la varianza de la puntuación observada atribuible a la varianza de la puntuación verdadera; Lord y Novick dieron al campo su formulación estadística rigurosa.
- Validez de constructo unificada
- Cronbach y Meehl enmarcaron la validez en torno al constructo que infiere una prueba, y Messick unificó la evidencia de contenido, criterio y constructo en un único argumento sobre la justificación y las consecuencias de la interpretación de la puntuación.
Mechanisms
En el modelo clásico, una puntuación observada se trata como una puntuación verdadera más un error aleatorio, y la fiabilidad cuantifica la proporción de varianza que es varianza de puntuación verdadera; Lord y Novick formalizaron esto y los modelos posteriores de respuesta al ítem. La validez es la garantía de que una puntuación respalda una inferencia prevista: Cronbach y Meehl la situaron en el constructo y su red nomológica, Haynes y sus colegas detallaron la validez de contenido como la correspondencia sistemática de los ítems con el dominio objetivo, y Messick unificó los tipos de evidencia en un argumento que también sopesa las consecuencias de la interpretación. Las normas y la estandarización hacen que las puntuaciones sean comparables al referenciarlas a una población definida.
Clinical relevance
Las propiedades psicométricas determinan si se puede confiar en la puntuación de una prueba clínica y qué puede significar, por lo que la evidencia de fiabilidad y validez sustenta todo uso defendible de las pruebas en psicología clínica. Esta entrada explica esas propiedades como conceptos de medición; no recomienda instrumentos específicos ni puntos de corte para ninguna persona.
Evidence & guidelines
Los Estándares para Pruebas Educativas y Psicológicas (Standards for Educational and Psychological Testing) codifican las expectativas de fiabilidad, validez y equidad en el desarrollo y uso de pruebas. Cronbach y Meehl, Messick, y Haynes y sus colegas son referencias metodológicas estándar para el marco de validez, y Lord y Novick es la declaración canónica de la teoría clásica de los tests y la teoría de respuesta al ítem.
History
La medición mental surgió del trabajo del siglo XIX sobre las diferencias individuales y se sistematizó como teoría clásica de los tests en la primera mitad del siglo XX. El artículo de Cronbach y Meehl de 1955 hizo que la validez de constructo fuera central, la monografía de Lord y Novick de 1968 dio al campo una base estadística y de respuesta al ítem rigurosa, y la síntesis posterior de Messick unificó el concepto de validez en torno a la justificación de las inferencias y sus consecuencias sociales.
Debates
- ¿Es la validez una propiedad de las pruebas o de las inferencias?
- El campo pasó en gran medida de hablar de pruebas válidas a validar las inferencias y los usos derivados de las puntuaciones, con una discusión continua sobre hasta qué punto las consecuencias de las pruebas pertenecen al concepto de validez.
Key figures
- Lee Cronbach
- Paul Meehl
- Samuel Messick
- Frederic Lord
- Melvin Novick
Related topics
Seminal works
- cronbach-meehl-1955
- lord-novick-1968
- messick-1995
Frequently asked questions
- ¿Cuál es la diferencia entre fiabilidad y validez?
- La fiabilidad es la consistencia de una medición (cuán poco se ve afectada por el error aleatorio), mientras que la validez es si la inferencia extraída de una puntuación está justificada; una prueba puede ser fiable sin ser válida para un propósito dado, pero no puede ser válida sin ser razonablemente fiable.
- ¿Qué significa la validez de constructo?
- Es el grado en que una prueba puede interpretarse como la medición de un atributo previsto y teóricamente definido, establecido mediante la acumulación de evidencia de que la prueba se relaciona con otras variables como predice la teoría.