Qual a diferença entre fidedignidade e validade?

Fidedignidade é a consistência de uma medida (o quão pouco ela é afetada por erro aleatório), enquanto validade é se a inferência tirada de uma pontuação é justificada; um teste pode ser fidedigno sem ser válido para um determinado propósito, mas não pode ser válido sem ser razoavelmente fidedigno.

O que significa validade de construto?

É o grau em que um teste pode ser interpretado como medindo um atributo pretendido e teoricamente definido, estabelecido pela acumulação de evidências de que o teste se relaciona com outras variáveis conforme a teoria prevê.

Testes Psicológicos e Psicometria

A psicometria é a ciência da medição de atributos psicológicos: como os testes são construídos, como suas pontuações são quantificadas e como a fidedignidade, a validade e a imparcialidade são estabelecidas para que um número derivado de um teste possa ser interpretado com confiança.

Encontrar tema com PaperMindEm breveFind papers & topics

Tools & resources

Baixar slides

Learn & explore

VídeoEm breve

Definition

Psicometria é o ramo da psicologia que se ocupa da teoria e técnica da medição psicológica, incluindo o desenho, administração, pontuação e validação de testes e os modelos estatísticos que relacionam as pontuações observadas a atributos subjacentes.

Scope

Este tópico abrange a teoria e os métodos que transformam respostas em pontuações interpretáveis: a teoria clássica dos testes e o modelo de pontuação verdadeira, fidedignidade e erro de medição, a estrutura de validade, análise em nível de item, normatização e padronização, e imparcialidade dos testes. É uma entrada metodológica sobre medição, não uma orientação sobre como escolher ou pontuar testes para qualquer indivíduo.

Core questions

Quanto de uma pontuação observada reflete o atributo versus o erro de medição?
Que evidências são necessárias antes que uma pontuação possa ser interpretada como medindo um construto pretendido?
Como os itens de teste são analisados, selecionados e escalonados?
Como as pontuações são tornadas comparáveis entre as pessoas por meio de normas e padronização?

Key concepts

Pontuação verdadeira e erro de medição
Fidedignidade (consistência interna, teste-reteste, interavaliadores)
Validade de conteúdo, de critério e de construto
Análise de itens e dificuldade/discriminação
Normas, padronização e pontuações padrão
Teoria de resposta ao item
Invariância de medida e imparcialidade do teste

Key theories

Teoria clássica dos testes: A teoria clássica dos testes modela uma pontuação observada como a soma de uma pontuação verdadeira e erro aleatório, a partir da qual a fidedignidade é definida como a proporção da variância da pontuação observada atribuível à variância da pontuação verdadeira; Lord e Novick deram ao campo sua formulação estatística rigorosa.
Validade de construto unificada: Cronbach e Meehl enquadraram a validade em torno do construto que um teste infere, e Messick unificou as evidências de conteúdo, critério e construto em um único argumento sobre a justificativa e as consequências da interpretação da pontuação.

Mechanisms

No modelo clássico, uma pontuação observada é tratada como uma pontuação verdadeira mais erro aleatório, e a fidedignidade quantifica a parcela da variância que é variância da pontuação verdadeira; Lord e Novick formalizaram isso e os modelos posteriores de resposta ao item. A validade é a garantia de que uma pontuação suporta uma inferência pretendida: Cronbach e Meehl a localizaram no construto e em sua rede nomológica, Haynes e colegas detalharam a validade de conteúdo como a correspondência sistemática de itens ao domínio-alvo, e Messick unificou os tipos de evidência em um argumento que também pondera as consequências da interpretação. Normas e padronização tornam as pontuações comparáveis, referenciando-as a uma população definida.

Clinical relevance

As propriedades psicométricas determinam se uma pontuação de teste clínico pode ser confiável e o que ela pode significar, de modo que a evidência de fidedignidade e validade sustenta todo uso defensável de testes em psicologia clínica. Esta entrada explica essas propriedades como conceitos de medição; ela não recomenda instrumentos específicos ou pontos de corte para qualquer pessoa.

Evidence & guidelines

Os Padrões para Testes Educacionais e Psicológicos (Standards for Educational and Psychological Testing) codificam as expectativas para fidedignidade, validade e imparcialidade no desenvolvimento e uso de testes. Cronbach e Meehl, Messick, e Haynes e colegas são referências metodológicas padrão para a estrutura de validade, e Lord e Novick é a declaração canônica da teoria clássica dos testes e da teoria de resposta ao item.

History

A medição mental emergiu do trabalho do século XIX sobre diferenças individuais e foi sistematizada como teoria clássica dos testes na primeira metade do século XX. O artigo de Cronbach e Meehl de 1955 tornou a validade de construto central, a monografia de Lord e Novick de 1968 deu ao campo uma base estatística e de resposta ao item rigorosa, e a síntese posterior de Messick unificou o conceito de validade em torno da justificativa das inferências e suas consequências sociais.

Debates

A validade é uma propriedade dos testes ou das inferências?: O campo passou em grande parte de falar de testes válidos para validar as inferências e usos derivados das pontuações, com discussão contínua sobre até que ponto as consequências dos testes se encaixam no conceito de validade.

Key figures

Lee Cronbach
Paul Meehl
Samuel Messick
Frederic Lord
Melvin Novick

Seminal works

cronbach-meehl-1955
lord-novick-1968
messick-1995

Frequently asked questions

Qual a diferença entre fidedignidade e validade?: Fidedignidade é a consistência de uma medida (o quão pouco ela é afetada por erro aleatório), enquanto validade é se a inferência tirada de uma pontuação é justificada; um teste pode ser fidedigno sem ser válido para um determinado propósito, mas não pode ser válido sem ser razoavelmente fidedigno.
O que significa validade de construto?: É o grau em que um teste pode ser interpretado como medindo um atributo pretendido e teoricamente definido, estabelecido pela acumulação de evidências de que o teste se relaciona com outras variáveis conforme a teoria prevê.