¿Cuál es la diferencia entre fiabilidad y validez?

La fiabilidad es la consistencia de una medición (cuán poco se ve afectada por el error aleatorio), mientras que la validez es si la inferencia extraída de una puntuación está justificada; una prueba puede ser fiable sin ser válida para un propósito dado, pero no puede ser válida sin ser razonablemente fiable.

¿Qué significa la validez de constructo?

Es el grado en que una prueba puede interpretarse como la medición de un atributo previsto y teóricamente definido, establecido mediante la acumulación de evidencia de que la prueba se relaciona con otras variables como predice la teoría.

Pruebas psicológicas y psicometría

La psicometría es la ciencia de la medición de atributos psicológicos: cómo se construyen las pruebas, cómo se cuantifican sus puntuaciones y cómo se establecen la fiabilidad, la validez y la equidad para que un número derivado de una prueba pueda interpretarse con confianza.

Encontrar tema con PaperMindPróximamenteFind papers & topics

Tools & resources

Descargar diapositivas

Learn & explore

VídeoPróximamente

Definition

La psicometría es la rama de la psicología que se ocupa de la teoría y la técnica de la medición psicológica, incluyendo el diseño, la administración, la puntuación y la validación de pruebas, así como los modelos estadísticos que relacionan las puntuaciones observadas con los atributos subyacentes.

Scope

Este tema abarca la teoría y los métodos que convierten las respuestas en puntuaciones interpretables: la teoría clásica de los tests y el modelo de puntuación verdadera, la fiabilidad y el error de medición, el marco de validez, el análisis a nivel de ítem, la normalización y estandarización, y la equidad de las pruebas. Es una entrada metodológica sobre la medición, no una guía para elegir o puntuar pruebas para un individuo.

Core questions

¿Cuánto de una puntuación observada refleja el atributo frente al error de medición?
¿Qué evidencia se necesita antes de que una puntuación pueda interpretarse como la medición de un constructo previsto?
¿Cómo se analizan, seleccionan y escalan los ítems de una prueba?
¿Cómo se hacen comparables las puntuaciones entre personas mediante normas y estandarización?

Key concepts

Puntuación verdadera y error de medición
Fiabilidad (consistencia interna, test-retest, inter-evaluador)
Validez de contenido, de criterio y de constructo
Análisis de ítems y dificultad/discriminación
Normas, estandarización y puntuaciones estándar
Teoría de respuesta al ítem
Invarianza de la medición y equidad de las pruebas

Key theories

Teoría clásica de los tests: La teoría clásica de los tests modela una puntuación observada como la suma de una puntuación verdadera y un error aleatorio, a partir de lo cual la fiabilidad se define como la proporción de la varianza de la puntuación observada atribuible a la varianza de la puntuación verdadera; Lord y Novick dieron al campo su formulación estadística rigurosa.
Validez de constructo unificada: Cronbach y Meehl enmarcaron la validez en torno al constructo que infiere una prueba, y Messick unificó la evidencia de contenido, criterio y constructo en un único argumento sobre la justificación y las consecuencias de la interpretación de la puntuación.

Mechanisms

En el modelo clásico, una puntuación observada se trata como una puntuación verdadera más un error aleatorio, y la fiabilidad cuantifica la proporción de varianza que es varianza de puntuación verdadera; Lord y Novick formalizaron esto y los modelos posteriores de respuesta al ítem. La validez es la garantía de que una puntuación respalda una inferencia prevista: Cronbach y Meehl la situaron en el constructo y su red nomológica, Haynes y sus colegas detallaron la validez de contenido como la correspondencia sistemática de los ítems con el dominio objetivo, y Messick unificó los tipos de evidencia en un argumento que también sopesa las consecuencias de la interpretación. Las normas y la estandarización hacen que las puntuaciones sean comparables al referenciarlas a una población definida.

Clinical relevance

Las propiedades psicométricas determinan si se puede confiar en la puntuación de una prueba clínica y qué puede significar, por lo que la evidencia de fiabilidad y validez sustenta todo uso defendible de las pruebas en psicología clínica. Esta entrada explica esas propiedades como conceptos de medición; no recomienda instrumentos específicos ni puntos de corte para ninguna persona.

Evidence & guidelines

Los Estándares para Pruebas Educativas y Psicológicas (Standards for Educational and Psychological Testing) codifican las expectativas de fiabilidad, validez y equidad en el desarrollo y uso de pruebas. Cronbach y Meehl, Messick, y Haynes y sus colegas son referencias metodológicas estándar para el marco de validez, y Lord y Novick es la declaración canónica de la teoría clásica de los tests y la teoría de respuesta al ítem.

History

La medición mental surgió del trabajo del siglo XIX sobre las diferencias individuales y se sistematizó como teoría clásica de los tests en la primera mitad del siglo XX. El artículo de Cronbach y Meehl de 1955 hizo que la validez de constructo fuera central, la monografía de Lord y Novick de 1968 dio al campo una base estadística y de respuesta al ítem rigurosa, y la síntesis posterior de Messick unificó el concepto de validez en torno a la justificación de las inferencias y sus consecuencias sociales.

Debates

¿Es la validez una propiedad de las pruebas o de las inferencias?: El campo pasó en gran medida de hablar de pruebas válidas a validar las inferencias y los usos derivados de las puntuaciones, con una discusión continua sobre hasta qué punto las consecuencias de las pruebas pertenecen al concepto de validez.

Key figures

Lee Cronbach
Paul Meehl
Samuel Messick
Frederic Lord
Melvin Novick

Seminal works

cronbach-meehl-1955
lord-novick-1968
messick-1995

Frequently asked questions

¿Cuál es la diferencia entre fiabilidad y validez?: La fiabilidad es la consistencia de una medición (cuán poco se ve afectada por el error aleatorio), mientras que la validez es si la inferencia extraída de una puntuación está justificada; una prueba puede ser fiable sin ser válida para un propósito dado, pero no puede ser válida sin ser razonablemente fiable.
¿Qué significa la validez de constructo?: Es el grado en que una prueba puede interpretarse como la medición de un atributo previsto y teóricamente definido, establecido mediante la acumulación de evidencia de que la prueba se relaciona con otras variables como predice la teoría.