Testes Psicológicos e Psicometria
A psicometria é a ciência da medição de atributos psicológicos: como os testes são construídos, como suas pontuações são quantificadas e como a fidedignidade, a validade e a imparcialidade são estabelecidas para que um número derivado de um teste possa ser interpretado com confiança.
Definition
Psicometria é o ramo da psicologia que se ocupa da teoria e técnica da medição psicológica, incluindo o desenho, administração, pontuação e validação de testes e os modelos estatísticos que relacionam as pontuações observadas a atributos subjacentes.
Scope
Este tópico abrange a teoria e os métodos que transformam respostas em pontuações interpretáveis: a teoria clássica dos testes e o modelo de pontuação verdadeira, fidedignidade e erro de medição, a estrutura de validade, análise em nível de item, normatização e padronização, e imparcialidade dos testes. É uma entrada metodológica sobre medição, não uma orientação sobre como escolher ou pontuar testes para qualquer indivíduo.
Core questions
- Quanto de uma pontuação observada reflete o atributo versus o erro de medição?
- Que evidências são necessárias antes que uma pontuação possa ser interpretada como medindo um construto pretendido?
- Como os itens de teste são analisados, selecionados e escalonados?
- Como as pontuações são tornadas comparáveis entre as pessoas por meio de normas e padronização?
Key concepts
- Pontuação verdadeira e erro de medição
- Fidedignidade (consistência interna, teste-reteste, interavaliadores)
- Validade de conteúdo, de critério e de construto
- Análise de itens e dificuldade/discriminação
- Normas, padronização e pontuações padrão
- Teoria de resposta ao item
- Invariância de medida e imparcialidade do teste
Key theories
- Teoria clássica dos testes
- A teoria clássica dos testes modela uma pontuação observada como a soma de uma pontuação verdadeira e erro aleatório, a partir da qual a fidedignidade é definida como a proporção da variância da pontuação observada atribuível à variância da pontuação verdadeira; Lord e Novick deram ao campo sua formulação estatística rigorosa.
- Validade de construto unificada
- Cronbach e Meehl enquadraram a validade em torno do construto que um teste infere, e Messick unificou as evidências de conteúdo, critério e construto em um único argumento sobre a justificativa e as consequências da interpretação da pontuação.
Mechanisms
No modelo clássico, uma pontuação observada é tratada como uma pontuação verdadeira mais erro aleatório, e a fidedignidade quantifica a parcela da variância que é variância da pontuação verdadeira; Lord e Novick formalizaram isso e os modelos posteriores de resposta ao item. A validade é a garantia de que uma pontuação suporta uma inferência pretendida: Cronbach e Meehl a localizaram no construto e em sua rede nomológica, Haynes e colegas detalharam a validade de conteúdo como a correspondência sistemática de itens ao domínio-alvo, e Messick unificou os tipos de evidência em um argumento que também pondera as consequências da interpretação. Normas e padronização tornam as pontuações comparáveis, referenciando-as a uma população definida.
Clinical relevance
As propriedades psicométricas determinam se uma pontuação de teste clínico pode ser confiável e o que ela pode significar, de modo que a evidência de fidedignidade e validade sustenta todo uso defensável de testes em psicologia clínica. Esta entrada explica essas propriedades como conceitos de medição; ela não recomenda instrumentos específicos ou pontos de corte para qualquer pessoa.
Evidence & guidelines
Os Padrões para Testes Educacionais e Psicológicos (Standards for Educational and Psychological Testing) codificam as expectativas para fidedignidade, validade e imparcialidade no desenvolvimento e uso de testes. Cronbach e Meehl, Messick, e Haynes e colegas são referências metodológicas padrão para a estrutura de validade, e Lord e Novick é a declaração canônica da teoria clássica dos testes e da teoria de resposta ao item.
History
A medição mental emergiu do trabalho do século XIX sobre diferenças individuais e foi sistematizada como teoria clássica dos testes na primeira metade do século XX. O artigo de Cronbach e Meehl de 1955 tornou a validade de construto central, a monografia de Lord e Novick de 1968 deu ao campo uma base estatística e de resposta ao item rigorosa, e a síntese posterior de Messick unificou o conceito de validade em torno da justificativa das inferências e suas consequências sociais.
Debates
- A validade é uma propriedade dos testes ou das inferências?
- O campo passou em grande parte de falar de testes válidos para validar as inferências e usos derivados das pontuações, com discussão contínua sobre até que ponto as consequências dos testes se encaixam no conceito de validade.
Key figures
- Lee Cronbach
- Paul Meehl
- Samuel Messick
- Frederic Lord
- Melvin Novick
Related topics
Seminal works
- cronbach-meehl-1955
- lord-novick-1968
- messick-1995
Frequently asked questions
- Qual a diferença entre fidedignidade e validade?
- Fidedignidade é a consistência de uma medida (o quão pouco ela é afetada por erro aleatório), enquanto validade é se a inferência tirada de uma pontuação é justificada; um teste pode ser fidedigno sem ser válido para um determinado propósito, mas não pode ser válido sem ser razoavelmente fidedigno.
- O que significa validade de construto?
- É o grau em que um teste pode ser interpretado como medindo um atributo pretendido e teoricamente definido, estabelecido pela acumulação de evidências de que o teste se relaciona com outras variáveis conforme a teoria prevê.