Intervalos de Confiança
Um intervalo de confiança é um intervalo de valores plausíveis para uma quantidade populacional desconhecida, calculado a partir de dados amostrais de modo que o procedimento utilizado para construí-lo capture o valor verdadeiro numa proporção declarada do tempo - convencionalmente 95% - em amostras repetidas. Ele expressa tanto a magnitude de uma estimativa quanto a incerteza em torno dela em um resumo único e amplamente divulgado, e tornou-se a forma preferida de apresentar estimativas de efeito nas ciências da saúde.
Definition
Um intervalo de confiança é um intervalo, calculado a partir de dados amostrais por um método definido em um nível de confiança declarado, de modo que o método conteria o verdadeiro parâmetro populacional nessa proporção declarada de amostras hipotéticas repetidas.
Scope
Este tópico explica o que é um intervalo de confiança, como seu nível de confiança deve ser interpretado, como a largura do intervalo reflete a precisão e o tamanho da amostra, e as formas comuns pelas quais o conceito é mal compreendido. É apresentado como uma metodologia de referência para avaliar e relatar pesquisas, e não como uma regra de decisão clínica.
Core questions
- Qual intervalo de valores para o parâmetro é plausivelmente consistente com os dados?
- O que o nível de confiança realmente garante?
- Como o tamanho da amostra e a variabilidade determinam a largura do intervalo?
- Como um intervalo de confiança se relaciona com um teste de hipótese ou valor-p?
Key concepts
- Nível de confiança
- Probabilidade de cobertura
- Largura e precisão do intervalo
- Limites de confiança inferior e superior
- Interpretação frequentista
- Relação com o valor nulo
- Intervalos exatos versus aproximados
Mechanisms
Um intervalo de confiança é tipicamente formado tomando uma estimativa pontual e estendendo-a por um múltiplo de seu erro padrão, onde o múltiplo é definido pelo nível de confiança desejado e pela distribuição amostral relevante. A propriedade frequentista definidora é a cobertura: se o estudo fosse repetido muitas vezes, os intervalos construídos dessa forma conteriam o parâmetro verdadeiro na proporção declarada de repetições. O intervalo se estreita à medida que a amostra cresce ou a variabilidade diminui, de modo que a largura é uma leitura direta da precisão. Um atalho comum liga intervalos a testes - se um intervalo de 95% para uma diferença exclui o valor nulo, o teste bicaudal correspondente é significativo no nível de 5% - mas o intervalo transmite mais ao mostrar toda a gama de valores compatíveis. Um erro frequente é ler o nível como a probabilidade de que o valor verdadeiro esteja dentro de um intervalo particular, o que a definição frequentista não suporta.
Clinical relevance
Os intervalos de confiança acompanham a maioria das estimativas de efeito em relatórios clínicos e epidemiológicos, permitindo que os leitores julguem não apenas se um efeito está presente, mas quão grande e quão precisamente ele é estimado. Um intervalo amplo sinaliza um estudo inconclusivo, mesmo quando uma estimativa pontual parece impressionante. Esta entrada descreve como os intervalos são construídos e interpretados e não é uma base para decisões individuais de diagnóstico ou tratamento.
Evidence & guidelines
As diretrizes de relatórios e as convenções editoriais em medicina agora esperam rotineiramente que as estimativas de efeito sejam apresentadas com intervalos de confiança. A declaração da American Statistical Association sobre valores-p e o guia de má interpretação de Greenland e colegas enfatizam a interpretação correta dos intervalos juntamente com os valores-p, baseando-se na defesa anterior de Gardner e Altman para relatórios baseados em intervalos.
History
O intervalo de confiança foi introduzido por Jerzy Neyman na década de 1930 como uma abordagem frequentista para a estimação por intervalo, com construções exatas iniciais, como os limites de Clopper-Pearson para uma proporção binomial, aparecendo em 1934. Seu uso rotineiro na medicina foi impulsionado mais tarde no século XX, notavelmente pela defesa de Gardner e Altman em 1986 para relatar intervalos em vez de valores-p nus, o que reformulou as convenções dos periódicos.
Debates
- Má interpretação do nível de confiança
- O nível de confiança descreve o desempenho a longo prazo do procedimento de construção do intervalo, não a probabilidade de que um intervalo particular calculado contenha o valor verdadeiro; essa distinção é amplamente mal compreendida e uma fonte recorrente de erro.
Key figures
- Jerzy Neyman
- Egon Pearson
- Martin J. Gardner
- Douglas G. Altman
- Sander Greenland
Related topics
Seminal works
- clopper-pearson-1934
- gardner-altman-1986
Frequently asked questions
- Um intervalo de confiança de 95% significa que há 95% de chance de o valor verdadeiro estar dentro dele?
- Não. Sob a definição frequentista, o valor verdadeiro é fixo, e os 95% referem-se à proporção a longo prazo de tais intervalos, construídos da mesma forma em amostras repetidas, que o conteriam - não à probabilidade para um intervalo específico.
- O que torna um intervalo de confiança estreito ou amplo?
- Principalmente o tamanho da amostra e a variabilidade: amostras maiores e dados menos variáveis produzem intervalos mais estreitos e precisos, enquanto estudos pequenos ou ruidosos produzem intervalos amplos que sinalizam incerteza.