Qual é a diferença entre estimação e teste de hipóteses?

A estimação pergunta quão grande é uma quantidade desconhecida e com que precisão a conhecemos, produzindo uma estimativa pontual e um intervalo; o teste de hipóteses pergunta se os dados são compatíveis com uma afirmação especificada e produz uma decisão ou valor de p. São visões complementares da mesma estatística subjacente.

Por que a inferência estatística é necessária?

Porque quase nunca observamos uma população inteira; trabalhamos com uma amostra que varia por acaso, então precisamos de métodos formais para separar o sinal da variabilidade amostral e para atribuir incerteza honesta às nossas conclusões.

Estimação e Inferência Estatística

A estimação e inferência estatística são o ramo da bioestatística que se ocupa de tirar conclusões sobre uma população a partir de uma amostra finita e variável. Fornece a maquinaria formal para duas tarefas complementares: estimar quantidades desconhecidas (como uma média, proporção ou efeito de tratamento) juntamente com uma margem de incerteza, e testar se os dados observados são compatíveis com uma hipótese declarada. Juntas, estas ferramentas transformam dados brutos de estudo em declarações quantificadas e conscientes da incerteza sobre o mundo.

Encontrar tema com PaperMindEm breveFind papers & topics

Tools & resources

Baixar slides

Learn & explore

VídeoEm breve

Definition

Inferência estatística é o processo de usar uma amostra de observações, juntamente com um modelo de probabilidade para como essas observações surgem, para estimar parâmetros populacionais e para quantificar a incerteza ou testar hipóteses sobre esses parâmetros.

Scope

Esta área orienta o leitor para as ideias centrais que se repetem na pesquisa em saúde: estimação pontual e intervalar, intervalos de confiança, o quadro de teste de hipóteses, os dois tipos de erro de decisão que pode produzir, e o poder estatístico e tamanho da amostra necessários para detetar efeitos de forma fiável. Trata estes tópicos como referências metodológicas para avaliar e desenhar estudos, e não como regras de decisão clínica.

Sub-topics

Core questions

Qual é a nossa melhor estimativa única de uma quantidade populacional desconhecida, e quão incerta ela é?
Que intervalo de valores é plausivelmente consistente com os dados observados?
Os dados são compatíveis com uma hipótese nula especificada, ou fornecem evidências contra ela?
Qual o tamanho da amostra necessário para detetar um efeito de um dado tamanho com taxas de erro aceitáveis?

Key concepts

Parâmetro populacional versus estatística amostral
Distribuição amostral e erro padrão
Estimativa pontual
Estimativa intervalar e intervalo de confiança
Hipóteses nula e alternativa
Valor de p
Erro Tipo I e Tipo II
Poder estatístico
Determinação do tamanho da amostra

Key theories

Teoria da decisão de Neyman-Pearson: Enquadrou o teste de hipóteses como uma decisão entre duas hipóteses governadas por taxas de erro de longo prazo controladas, introduzindo as noções formais de erro Tipo I e Tipo II e o teste mais potente para um nível de significância fixo.
Paradigma de estimação com incerteza: Argumenta que relatar estimativas de efeito com intervalos de confiança comunica mais do que um veredito de significância simples, mudando a ênfase de se um efeito existe para quão grande ele é plausivelmente.

Mechanisms

A inferência baseia-se num modelo de probabilidade que liga os dados a parâmetros desconhecidos e na ideia de uma distribuição amostral: a dispersão das estimativas que surgiriam em amostras repetidas. A estimação resume essa distribuição amostral como uma estimativa pontual mais uma medida de precisão (o erro padrão), que é então transformada num intervalo. O teste de hipóteses reformula a mesma distribuição como um problema de decisão, comparando os dados observados com o que a hipótese nula prevê e controlando a probabilidade de conclusões falso-positivas e falso-negativas. Os valores de p e os intervalos de confiança são duas faces deste único cálculo subjacente, e ambos são frequentemente mal interpretados, pelo que uma definição cuidadosa é importante.

Clinical relevance

Quase todos os achados quantitativos na literatura de saúde — uma razão de risco, uma diferença de média, um valor de precisão diagnóstica — são uma declaração inferencial que carrega incerteza. Compreender a estimação e a inferência é, portanto, central para ler e avaliar evidências, e para julgar se um efeito relatado é preciso, plausível e adequadamente potente. Esta área descreve como tal evidência é gerada e interpretada; não é uma base para decisões individuais de diagnóstico ou tratamento.

Evidence & guidelines

Organismos profissionais emitiram orientações explícitas para conter o uso indevido comum da estatística inferencial. A declaração da American Statistical Association de 2016 sobre valores de p estabeleceu princípios para a sua correta interpretação, e um guia complementar de Greenland e colegas cataloga vinte e cinco interpretações erróneas frequentes de valores de p, intervalos de confiança e poder. O apelo anterior de Gardner e Altman para favorecer os intervalos de confiança em detrimento dos valores de p brutos moldou as convenções de relato em periódicos médicos.

History

A inferência moderna surgiu de duas tradições parcialmente rivais no início do século XX: os testes de significância e valores de p de Fisher, e o quadro de teste de decisão-teórico que Neyman e Pearson formalizaram em 1933. O intervalo de confiança, também devido em grande parte a Neyman, forneceu uma visão complementar centrada na estimação. Ao longo do final do século XX, estatísticos e epidemiologistas criticaram cada vez mais a dependência mecânica de limiares de significância, culminando em declarações formais de cautela da comunidade estatística na década de 2010.

Debates

Teste de significância versus estimação: Um debate de longa data questiona se os vereditos dicotómicos de significância são enganosos, com muitos metodologistas argumentando que as estimativas de efeito e os intervalos de confiança devem ter precedência sobre os limiares de valor de p.

Key figures

Jerzy Neyman
Egon Pearson
Ronald A. Fisher
Douglas G. Altman
Sander Greenland

Seminal works

neyman-pearson-1933
gardner-altman-1986
wasserstein-lazar-2016

Frequently asked questions

Qual é a diferença entre estimação e teste de hipóteses?: A estimação pergunta quão grande é uma quantidade desconhecida e com que precisão a conhecemos, produzindo uma estimativa pontual e um intervalo; o teste de hipóteses pergunta se os dados são compatíveis com uma afirmação especificada e produz uma decisão ou valor de p. São visões complementares da mesma estatística subjacente.
Por que a inferência estatística é necessária?: Porque quase nunca observamos uma população inteira; trabalhamos com uma amostra que varia por acaso, então precisamos de métodos formais para separar o sinal da variabilidade amostral e para atribuir incerteza honesta às nossas conclusões.