Poder Estatístico e Tamanho da Amostra
O poder estatístico é a probabilidade de que um estudo detecte um efeito de um determinado tamanho quando esse efeito realmente existe — formalmente, um menos a taxa de erro Tipo II. A determinação do tamanho da amostra é a etapa de planejamento que escolhe quantos participantes são necessários para atingir um poder alvo, dado o tamanho do efeito esperado, o nível de significância escolhido e a variabilidade dos dados. Juntos, eles decidem se um estudo é grande o suficiente para dar à sua questão uma chance justa de resposta.
Definition
Poder estatístico é a probabilidade de que um teste rejeite corretamente uma hipótese nula falsa (detecta um efeito real de tamanho especificado); a determinação do tamanho da amostra é o cálculo do número de observações necessárias para atingir um poder alvo em um dado nível de significância para um tamanho de efeito e variabilidade assumidos.
Scope
Este tópico explica o que significa poder, as quatro quantidades interligadas de um cálculo de poder (tamanho do efeito, nível de significância, poder e tamanho da amostra) e as consequências de pesquisas com poder insuficiente. É apresentado como uma metodologia de referência para planejar e avaliar estudos, não como uma regra de decisão clínica.
Core questions
- Qual a probabilidade de o estudo detectar o efeito que procura?
- Quantos participantes são necessários para atingir um poder alvo?
- Como o tamanho do efeito, a variabilidade e o nível de significância impulsionam o tamanho da amostra?
- O que dá errado quando um estudo tem poder insuficiente?
Key concepts
- Poder estatístico (1 menos beta)
- Tamanho do efeito
- Nível de significância (alfa)
- Variabilidade e desvio padrão
- Cálculo a priori do tamanho da amostra
- Estudo com poder insuficiente
- Diferença mínima clinicamente importante
Mechanisms
Poder, nível de significância, tamanho do efeito e tamanho da amostra estão ligados de modo que a fixação de quaisquer três determina o quarto. Para um dado nível de significância, o poder aumenta à medida que o tamanho do efeito verdadeiro cresce, à medida que a variabilidade diminui e à medida que o tamanho da amostra aumenta. O cálculo do tamanho da amostra inverte essa relação: partindo de um tamanho de efeito assumido (muitas vezes um mínimo que vale a pena detectar), um nível de significância escolhido e um poder alvo — convencionalmente 80% ou 90% — ele resolve para o número de observações necessárias. O poder insuficiente não só aumenta a chance de perder efeitos reais (erro Tipo II), mas também torna quaisquer achados significativos mais propensos a serem exagerados ou falsos, porque apenas estimativas grandes, possivelmente inflacionadas, ultrapassam o limiar em um pequeno estudo.
Clinical relevance
Se um ensaio ou estudo foi adequadamente potente molda como seus resultados devem ser lidos: um resultado não significativo de um estudo com poder insuficiente é em grande parte pouco informativo em vez de tranquilizador, e justificar prospectivamente o tamanho da amostra é um elemento esperado do relato do estudo. Esta entrada descreve o raciocínio de poder e tamanho da amostra para fins de avaliação e design e não é uma base para decisões individuais de diagnóstico ou tratamento.
Evidence & guidelines
Os padrões de relato para ensaios clínicos e estudos observacionais esperam uma justificativa a priori do tamanho da amostra, e revisões metodológicas documentaram os danos generalizados do baixo poder. Button e colegas mostraram que campos cronicamente com poder insuficiente produzem literaturas não confiáveis, enquanto Altman e Bland e o guia de má interpretação de Greenland e colegas enfatizam que o baixo poder explica muitos resultados nulos pouco informativos.
History
O poder é um desdobramento direto da estrutura de teste de Neyman-Pearson, que definiu a taxa de erro Tipo II cujo complemento é o poder. O trabalho de Jacob Cohen a partir da década de 1960, consolidado em sua monografia de 1988, popularizou a análise sistemática de poder e as convenções de tamanho de efeito nas ciências da saúde e do comportamento. A preocupação com pesquisas com poder insuficiente intensificou-se nos debates sobre reprodutibilidade da década de 2010.
Debates
- Consequências do poder insuficiente crônico
- O baixo poder persistente não só inflaciona os falsos negativos, mas também reduz a probabilidade de que um achado estatisticamente significativo reflita um efeito verdadeiro e exagera o tamanho daqueles que são relatados, minando a confiabilidade de literaturas inteiras.
Key figures
- Jacob Cohen
- Jerzy Neyman
- Egon Pearson
- Douglas G. Altman
- John P. A. Ioannidis
Related topics
Seminal works
- cohen-1988
- button-2013
Frequently asked questions
- O que é poder estatístico em termos simples?
- É a chance de que um estudo detecte um efeito real de um determinado tamanho se esse efeito realmente existir. Maior poder significa uma melhor chance de não perder um efeito verdadeiro; 80% de poder é um alvo comum.
- Por que o tamanho da amostra é tão importante?
- Amostras maiores aumentam o poder e estreitam a precisão das estimativas, de modo que um estudo pode detectar de forma confiável o efeito que procura. Uma amostra muito pequena corre o risco tanto de perder efeitos reais quanto de produzir achados significativos exagerados.