Erros Tipo I e Tipo II
Os erros Tipo I e Tipo II são as duas formas pelas quais um teste de hipóteses pode chegar a uma conclusão errada. Um erro Tipo I é um falso positivo – rejeitar uma hipótese nula verdadeira e alegar um efeito que não existe – enquanto um erro Tipo II é um falso negativo – não conseguir detetar um efeito real. O nível de significância controla a taxa de erros Tipo I, e o complemento da taxa de erro Tipo II é o poder estatístico, de modo que os dois tipos de erro enquadram como o desenho do estudo equilibra os riscos de superestimar e subestimar.
Definition
Um erro Tipo I é a rejeição de uma hipótese nula que é de facto verdadeira (um falso positivo), ocorrendo com probabilidade alfa; um erro Tipo II é a falha em rejeitar uma hipótese nula que é de facto falsa (um falso negativo), ocorrendo com probabilidade beta.
Scope
Este tópico define os dois tipos de erro, relaciona-os com o nível de significância (alfa) e a taxa de erro Tipo II (beta), e explica a troca entre eles no desenho do estudo. É uma metodologia de referência para avaliar e planear estudos, não uma regra de decisão clínica.
Core questions
- O que significa chegar a uma conclusão falso-positiva versus falso-negativa?
- Como o nível de significância e a taxa de erro Tipo II se relacionam com esses erros?
- Por que a redução de uma taxa de erro pode aumentar a outra?
- Como o tamanho da amostra influencia a probabilidade de cada erro?
Key concepts
- Erro Tipo I (falso positivo)
- Erro Tipo II (falso negativo)
- Nível de significância (alfa)
- Taxa de erro Tipo II (beta)
- Poder como 1 menos beta
- Compensação de erros
- Testes múltiplos e falsos positivos inflacionados
Mechanisms
No esquema de Neyman-Pearson, um teste é desenhado fixando-se antecipadamente a taxa de erro Tipo I tolerável (alfa, o nível de significância), o que estabelece a frequência com que uma hipótese nula verdadeira será erroneamente rejeitada. A taxa de erro Tipo II (beta) é a probabilidade de não detetar um efeito real de um determinado tamanho, e um menos beta é o poder do teste. Para um tamanho de amostra fixo, as duas taxas de erro são inversamente proporcionais: tornar o teste mais rigoroso para reduzir falsos positivos aumenta a probabilidade de falsos negativos, e vice-versa. Aumentar o tamanho da amostra é a principal forma de reduzir ambos simultaneamente. Testar muitas hipóteses sem ajuste inflaciona a taxa de erro Tipo I geral, razão pela qual a multiplicidade é uma preocupação recorrente no desenho de estudos.
Clinical relevance
Estes tipos de erro subjazem à forma como as conclusões de ensaios e estudos observacionais podem induzir em erro: um achado falso-positivo pode promover uma intervenção ineficaz, enquanto um achado falso-negativo pode descartar uma intervenção útil. Avaliar se um estudo controlou as suas taxas de erro – e se um resultado nulo simplesmente reflete baixo poder – é fundamental para a avaliação da evidência. Esta entrada explica os erros inferenciais e não é uma base para decisões clínicas individuais.
Evidence & guidelines
Comentários metodológicos enfatizam que um resultado não significativo não é prova de ausência de efeito, uma vez que estudos com baixo poder tornam os erros Tipo II prováveis; a nota de Altman e Bland de que a ausência de evidência não é evidência de ausência capta isso diretamente. Revisões de pesquisas com baixo poder, como a análise de Button e colegas em neurociência, documentam como o baixo poder tanto inflaciona os falsos negativos quanto reduz a fiabilidade dos achados significativos.
History
A distinção entre erros do primeiro e segundo tipo foi introduzida por Neyman e Pearson na sua formalização de 1933 do teste de hipóteses, que enquadrou o desenho do teste como o controlo destas duas probabilidades de erro. As consequências práticas – especialmente os perigos do erro Tipo II em pequenos estudos – tornaram-se um tema recorrente nas críticas metodológicas do século XX e XXI à pesquisa em saúde e comportamento.
Debates
- Interpretação de resultados não significativos
- Como estudos com baixo poder frequentemente cometem erros Tipo II, um achado não significativo é muitas vezes mal interpretado como demonstrando ausência de efeito; metodologistas enfatizam que a ausência de evidência não é evidência de ausência.
Key figures
- Jerzy Neyman
- Egon Pearson
- Douglas G. Altman
- J. Martin Bland
- John P. A. Ioannidis
Related topics
Seminal works
- neyman-pearson-1933
- altman-bland-1995
Frequently asked questions
- Qual é a diferença entre um erro Tipo I e um erro Tipo II?
- Um erro Tipo I é um falso positivo – concluir que há um efeito quando não há – e um erro Tipo II é um falso negativo – não detetar um efeito real. As suas probabilidades são chamadas alfa e beta, respetivamente.
- Por que não posso simplesmente tornar ambas as taxas de erro o menor possível?
- Para um tamanho de amostra fixo, as duas são inversamente proporcionais: apertar o teste para cortar falsos positivos aumenta os falsos negativos. A principal forma de reduzir ambos simultaneamente é aumentar a amostra.