Distribuições Amostrais e Teorema do Limite Central
Uma distribuição amostral é a distribuição de probabilidade de uma estatística, como uma média amostral, em todas as amostras possíveis de um dado tamanho. O teorema do limite central afirma que, para amostras suficientemente grandes, a distribuição amostral da média é aproximadamente normal, independentemente da forma dos dados subjacentes. Juntos, eles explicam por que os intervalos de confiança e testes baseados na distribuição normal funcionam tão amplamente.
Definition
Uma distribuição amostral é a distribuição de valores que uma estatística assumiria em todas as amostras possíveis de um tamanho fixo de uma população; o teorema do limite central afirma que a distribuição amostral da média amostral se aproxima de uma distribuição normal à medida que o tamanho da amostra aumenta, qualquer que seja a forma da população.
Scope
A entrada aborda o conceito de distribuição amostral, o erro padrão como sua dispersão, o teorema do limite central e o papel do tamanho da amostra, e a distinção entre o desvio padrão de indivíduos e o erro padrão de uma estatística. Ela conecta essas ideias a intervalos de confiança e testes de hipóteses. É uma referência metodológica e não uma orientação clínica.
Core questions
- O que é a distribuição amostral de uma estatística e por que ela é importante?
- Como o erro padrão difere do desvio padrão?
- O que o teorema do limite central garante e sob quais condições?
- Como o tamanho da amostra afeta a precisão de uma estimativa?
Key concepts
- Estatística versus parâmetro
- Distribuição amostral
- Erro padrão
- Erro padrão versus desvio padrão
- Tamanho da amostra e precisão
- Normalidade aproximada da média
- Base de intervalos de confiança e testes
Key theories
- Teorema do limite central
- Para observações independentes de uma população com variância finita, a distribuição da média amostral tende a uma distribuição normal à medida que o tamanho da amostra cresce, independentemente da forma da população; isso justifica a inferência baseada na distribuição normal para médias, mesmo quando as medições individuais não são normais.
Mechanisms
Se amostras repetidas do mesmo tamanho fossem retiradas de uma população, uma estatística como a média variaria de amostra para amostra; a distribuição desses valores é a distribuição amostral, e seu desvio padrão é o erro padrão. Para uma média amostral, o erro padrão é igual ao desvio padrão da população dividido pela raiz quadrada do tamanho da amostra, de modo que a precisão melhora à medida que as amostras crescem, mas apenas com a raiz quadrada de n. O teorema do limite central acrescenta que, para amostras suficientemente grandes, essa distribuição amostral é aproximadamente normal, mesmo quando os próprios dados são assimétricos, desde que as observações sejam independentes e a variância seja finita. Este é o motor da inferência clássica: um intervalo de confiança para uma média é construído afastando-se um certo número de erros padrão da estimativa sob normalidade aproximada, e muitos testes de hipóteses comparam uma estimativa com sua distribuição amostral. O erro padrão, que diminui com o tamanho da amostra, deve ser distinguido do desvio padrão das observações individuais, que estima a dispersão da população e não diminui.
Clinical relevance
Os intervalos de confiança e os valores de p relatados em estudos clínicos e de saúde pública baseiam-se na distribuição amostral da estimativa e no teorema do limite central, portanto, compreendê-los ajuda a julgar a precisão dos efeitos relatados. Esta entrada é um pano de fundo metodológico e não uma base para decisões clínicas individuais.
History
Formas iniciais do teorema do limite central apareceram na aproximação normal de de Moivre para a binomial e no trabalho de Laplace por volta de 1810, e condições gerais rigorosas foram estabelecidas por Lyapunov e outros por volta de 1900. O ponto de vista da distribuição amostral tornou-se central para a inferência no início do século XX e permanece a justificativa padrão para intervalos de confiança e testes baseados na distribuição normal em bioestatística.
Debates
- Quão grande deve ser uma amostra para que o teorema do limite central se aplique?
- A aproximação melhora com o tamanho da amostra, mas o quão grande é grande o suficiente depende de quão assimétricos são os dados; para distribuições marcadamente assimétricas, amostras muito maiores são necessárias antes que a distribuição da média seja aceitavelmente normal, então nenhuma regra prática única se aplica a todos os casos.
Key figures
- Pierre-Simon Laplace
- Abraham de Moivre
- Aleksandr Lyapunov
Related topics
Seminal works
- altman-bland-2005-se
- rosner-2015
Frequently asked questions
- Qual é a diferença entre um desvio padrão e um erro padrão?
- Um desvio padrão mede a dispersão de observações individuais, enquanto um erro padrão mede a dispersão de uma estatística, como uma média amostral, entre as amostras; o erro padrão diminui à medida que o tamanho da amostra cresce, enquanto o desvio padrão estima uma quantidade populacional fixa.
- Por que podemos usar a distribuição normal para uma média mesmo quando os dados são assimétricos?
- O teorema do limite central afirma que a distribuição amostral da média se torna aproximadamente normal à medida que o tamanho da amostra aumenta, independentemente da forma dos dados, portanto, os métodos baseados na distribuição normal para a média são frequentemente válidos com amostras suficientemente grandes, mesmo quando os valores individuais não são normalmente distribuídos.