Estimação e Inferência Estatística
A estimação e inferência estatística são o ramo da bioestatística que se ocupa de tirar conclusões sobre uma população a partir de uma amostra finita e variável. Fornece a maquinaria formal para duas tarefas complementares: estimar quantidades desconhecidas (como uma média, proporção ou efeito de tratamento) juntamente com uma margem de incerteza, e testar se os dados observados são compatíveis com uma hipótese declarada. Juntas, estas ferramentas transformam dados brutos de estudo em declarações quantificadas e conscientes da incerteza sobre o mundo.
Definition
Inferência estatística é o processo de usar uma amostra de observações, juntamente com um modelo de probabilidade para como essas observações surgem, para estimar parâmetros populacionais e para quantificar a incerteza ou testar hipóteses sobre esses parâmetros.
Scope
Esta área orienta o leitor para as ideias centrais que se repetem na pesquisa em saúde: estimação pontual e intervalar, intervalos de confiança, o quadro de teste de hipóteses, os dois tipos de erro de decisão que pode produzir, e o poder estatístico e tamanho da amostra necessários para detetar efeitos de forma fiável. Trata estes tópicos como referências metodológicas para avaliar e desenhar estudos, e não como regras de decisão clínica.
Sub-topics
Core questions
- Qual é a nossa melhor estimativa única de uma quantidade populacional desconhecida, e quão incerta ela é?
- Que intervalo de valores é plausivelmente consistente com os dados observados?
- Os dados são compatíveis com uma hipótese nula especificada, ou fornecem evidências contra ela?
- Qual o tamanho da amostra necessário para detetar um efeito de um dado tamanho com taxas de erro aceitáveis?
Key concepts
- Parâmetro populacional versus estatística amostral
- Distribuição amostral e erro padrão
- Estimativa pontual
- Estimativa intervalar e intervalo de confiança
- Hipóteses nula e alternativa
- Valor de p
- Erro Tipo I e Tipo II
- Poder estatístico
- Determinação do tamanho da amostra
Key theories
- Teoria da decisão de Neyman-Pearson
- Enquadrou o teste de hipóteses como uma decisão entre duas hipóteses governadas por taxas de erro de longo prazo controladas, introduzindo as noções formais de erro Tipo I e Tipo II e o teste mais potente para um nível de significância fixo.
- Paradigma de estimação com incerteza
- Argumenta que relatar estimativas de efeito com intervalos de confiança comunica mais do que um veredito de significância simples, mudando a ênfase de se um efeito existe para quão grande ele é plausivelmente.
Mechanisms
A inferência baseia-se num modelo de probabilidade que liga os dados a parâmetros desconhecidos e na ideia de uma distribuição amostral: a dispersão das estimativas que surgiriam em amostras repetidas. A estimação resume essa distribuição amostral como uma estimativa pontual mais uma medida de precisão (o erro padrão), que é então transformada num intervalo. O teste de hipóteses reformula a mesma distribuição como um problema de decisão, comparando os dados observados com o que a hipótese nula prevê e controlando a probabilidade de conclusões falso-positivas e falso-negativas. Os valores de p e os intervalos de confiança são duas faces deste único cálculo subjacente, e ambos são frequentemente mal interpretados, pelo que uma definição cuidadosa é importante.
Clinical relevance
Quase todos os achados quantitativos na literatura de saúde — uma razão de risco, uma diferença de média, um valor de precisão diagnóstica — são uma declaração inferencial que carrega incerteza. Compreender a estimação e a inferência é, portanto, central para ler e avaliar evidências, e para julgar se um efeito relatado é preciso, plausível e adequadamente potente. Esta área descreve como tal evidência é gerada e interpretada; não é uma base para decisões individuais de diagnóstico ou tratamento.
Evidence & guidelines
Organismos profissionais emitiram orientações explícitas para conter o uso indevido comum da estatística inferencial. A declaração da American Statistical Association de 2016 sobre valores de p estabeleceu princípios para a sua correta interpretação, e um guia complementar de Greenland e colegas cataloga vinte e cinco interpretações erróneas frequentes de valores de p, intervalos de confiança e poder. O apelo anterior de Gardner e Altman para favorecer os intervalos de confiança em detrimento dos valores de p brutos moldou as convenções de relato em periódicos médicos.
History
A inferência moderna surgiu de duas tradições parcialmente rivais no início do século XX: os testes de significância e valores de p de Fisher, e o quadro de teste de decisão-teórico que Neyman e Pearson formalizaram em 1933. O intervalo de confiança, também devido em grande parte a Neyman, forneceu uma visão complementar centrada na estimação. Ao longo do final do século XX, estatísticos e epidemiologistas criticaram cada vez mais a dependência mecânica de limiares de significância, culminando em declarações formais de cautela da comunidade estatística na década de 2010.
Debates
- Teste de significância versus estimação
- Um debate de longa data questiona se os vereditos dicotómicos de significância são enganosos, com muitos metodologistas argumentando que as estimativas de efeito e os intervalos de confiança devem ter precedência sobre os limiares de valor de p.
Key figures
- Jerzy Neyman
- Egon Pearson
- Ronald A. Fisher
- Douglas G. Altman
- Sander Greenland
Related topics
Seminal works
- neyman-pearson-1933
- gardner-altman-1986
- wasserstein-lazar-2016
Frequently asked questions
- Qual é a diferença entre estimação e teste de hipóteses?
- A estimação pergunta quão grande é uma quantidade desconhecida e com que precisão a conhecemos, produzindo uma estimativa pontual e um intervalo; o teste de hipóteses pergunta se os dados são compatíveis com uma afirmação especificada e produz uma decisão ou valor de p. São visões complementares da mesma estatística subjacente.
- Por que a inferência estatística é necessária?
- Porque quase nunca observamos uma população inteira; trabalhamos com uma amostra que varia por acaso, então precisamos de métodos formais para separar o sinal da variabilidade amostral e para atribuir incerteza honesta às nossas conclusões.