Qual é a diferença entre um erro Tipo I e um erro Tipo II?

Um erro Tipo I é um falso positivo – concluir que há um efeito quando não há – e um erro Tipo II é um falso negativo – não detetar um efeito real. As suas probabilidades são chamadas alfa e beta, respetivamente.

Por que não posso simplesmente tornar ambas as taxas de erro o menor possível?

Para um tamanho de amostra fixo, as duas são inversamente proporcionais: apertar o teste para cortar falsos positivos aumenta os falsos negativos. A principal forma de reduzir ambos simultaneamente é aumentar a amostra.

Erros Tipo I e Tipo II

Os erros Tipo I e Tipo II são as duas formas pelas quais um teste de hipóteses pode chegar a uma conclusão errada. Um erro Tipo I é um falso positivo – rejeitar uma hipótese nula verdadeira e alegar um efeito que não existe – enquanto um erro Tipo II é um falso negativo – não conseguir detetar um efeito real. O nível de significância controla a taxa de erros Tipo I, e o complemento da taxa de erro Tipo II é o poder estatístico, de modo que os dois tipos de erro enquadram como o desenho do estudo equilibra os riscos de superestimar e subestimar.

Encontrar tema com PaperMindEm breveFind papers & topics

Tools & resources

Baixar slides

Learn & explore

VídeoEm breve

Definition

Um erro Tipo I é a rejeição de uma hipótese nula que é de facto verdadeira (um falso positivo), ocorrendo com probabilidade alfa; um erro Tipo II é a falha em rejeitar uma hipótese nula que é de facto falsa (um falso negativo), ocorrendo com probabilidade beta.

Scope

Este tópico define os dois tipos de erro, relaciona-os com o nível de significância (alfa) e a taxa de erro Tipo II (beta), e explica a troca entre eles no desenho do estudo. É uma metodologia de referência para avaliar e planear estudos, não uma regra de decisão clínica.

Core questions

O que significa chegar a uma conclusão falso-positiva versus falso-negativa?
Como o nível de significância e a taxa de erro Tipo II se relacionam com esses erros?
Por que a redução de uma taxa de erro pode aumentar a outra?
Como o tamanho da amostra influencia a probabilidade de cada erro?

Key concepts

Erro Tipo I (falso positivo)
Erro Tipo II (falso negativo)
Nível de significância (alfa)
Taxa de erro Tipo II (beta)
Poder como 1 menos beta
Compensação de erros
Testes múltiplos e falsos positivos inflacionados

Mechanisms

No esquema de Neyman-Pearson, um teste é desenhado fixando-se antecipadamente a taxa de erro Tipo I tolerável (alfa, o nível de significância), o que estabelece a frequência com que uma hipótese nula verdadeira será erroneamente rejeitada. A taxa de erro Tipo II (beta) é a probabilidade de não detetar um efeito real de um determinado tamanho, e um menos beta é o poder do teste. Para um tamanho de amostra fixo, as duas taxas de erro são inversamente proporcionais: tornar o teste mais rigoroso para reduzir falsos positivos aumenta a probabilidade de falsos negativos, e vice-versa. Aumentar o tamanho da amostra é a principal forma de reduzir ambos simultaneamente. Testar muitas hipóteses sem ajuste inflaciona a taxa de erro Tipo I geral, razão pela qual a multiplicidade é uma preocupação recorrente no desenho de estudos.

Clinical relevance

Estes tipos de erro subjazem à forma como as conclusões de ensaios e estudos observacionais podem induzir em erro: um achado falso-positivo pode promover uma intervenção ineficaz, enquanto um achado falso-negativo pode descartar uma intervenção útil. Avaliar se um estudo controlou as suas taxas de erro – e se um resultado nulo simplesmente reflete baixo poder – é fundamental para a avaliação da evidência. Esta entrada explica os erros inferenciais e não é uma base para decisões clínicas individuais.

Evidence & guidelines

Comentários metodológicos enfatizam que um resultado não significativo não é prova de ausência de efeito, uma vez que estudos com baixo poder tornam os erros Tipo II prováveis; a nota de Altman e Bland de que a ausência de evidência não é evidência de ausência capta isso diretamente. Revisões de pesquisas com baixo poder, como a análise de Button e colegas em neurociência, documentam como o baixo poder tanto inflaciona os falsos negativos quanto reduz a fiabilidade dos achados significativos.

History

A distinção entre erros do primeiro e segundo tipo foi introduzida por Neyman e Pearson na sua formalização de 1933 do teste de hipóteses, que enquadrou o desenho do teste como o controlo destas duas probabilidades de erro. As consequências práticas – especialmente os perigos do erro Tipo II em pequenos estudos – tornaram-se um tema recorrente nas críticas metodológicas do século XX e XXI à pesquisa em saúde e comportamento.

Debates

Interpretação de resultados não significativos: Como estudos com baixo poder frequentemente cometem erros Tipo II, um achado não significativo é muitas vezes mal interpretado como demonstrando ausência de efeito; metodologistas enfatizam que a ausência de evidência não é evidência de ausência.

Key figures

Jerzy Neyman
Egon Pearson
Douglas G. Altman
J. Martin Bland
John P. A. Ioannidis

Seminal works

neyman-pearson-1933
altman-bland-1995

Frequently asked questions

Qual é a diferença entre um erro Tipo I e um erro Tipo II?: Um erro Tipo I é um falso positivo – concluir que há um efeito quando não há – e um erro Tipo II é um falso negativo – não detetar um efeito real. As suas probabilidades são chamadas alfa e beta, respetivamente.
Por que não posso simplesmente tornar ambas as taxas de erro o menor possível?: Para um tamanho de amostra fixo, as duas são inversamente proporcionais: apertar o teste para cortar falsos positivos aumenta os falsos negativos. A principal forma de reduzir ambos simultaneamente é aumentar a amostra.