Distribuição Normal
A distribuição normal, também chamada de distribuição gaussiana ou curva em sino, é uma distribuição contínua que é simétrica em torno de sua média e totalmente descrita por sua média e desvio padrão. É a distribuição mais importante em bioestatística porque muitas medições a aproximam e porque as médias amostrais tendem a ela, tornando-a a base da maioria das inferências estatísticas padrão.
Definition
A distribuição normal é uma distribuição de probabilidade contínua com uma densidade simétrica em forma de sino, determinada inteiramente por dois parâmetros: sua média (centro) e desvio padrão (dispersão).
Scope
A entrada abrange a forma e os parâmetros da distribuição normal, a regra empírica que relaciona os desvios padrão à cobertura, a distribuição normal padrão e os escores-z, os intervalos de referência e a distinção entre uma distribuição normal de indivíduos e uma distribuição normal de médias amostrais. É uma referência metodológica e não fornece limiares clínicos para pacientes individuais.
Core questions
- Que forma tem a distribuição normal e o que a determina?
- Quanto da distribuição está dentro de um dado número de desvios padrão?
- O que é um escore-z e como funciona a padronização?
- Quando é apropriado assumir a normalidade?
Key concepts
- Média e desvio padrão
- Simetria e forma de sino
- Regra empírica (68-95-99,7)
- Distribuição normal padrão
- Escore-z e padronização
- Intervalo de referência
- Assimetria e desvios da normalidade
Mechanisms
Uma distribuição normal é definida por dois números: a média, que localiza seu centro, e o desvio padrão, que define sua largura. Aproximadamente 68% dos valores caem dentro de um desvio padrão da média, cerca de 95% dentro de dois e cerca de 99,7% dentro de três — a regra empírica que confere à distribuição sua utilidade prática. Qualquer variável normal pode ser padronizada subtraindo a média e dividindo pelo desvio padrão para obter um escore-z que segue a distribuição normal padrão (média 0, desvio padrão 1), o que permite que um único conjunto de tabelas ou fórmulas sirva a todas as distribuições normais. Em pesquisa médica, os intervalos de referência para medições como valores sanguíneos são frequentemente construídos a partir dos 95% centrais de uma distribuição normal assumida, e muitos testes estatísticos pressupõem que os dados ou a distribuição amostral de uma estatística são aproximadamente normais.
Clinical relevance
Muitas medições biológicas são resumidas e comparadas sob a suposição de normalidade aproximada, e os intervalos de referência são frequentemente construídos a partir dela, de modo que a compreensão da distribuição auxilia na interpretação de resultados laboratoriais e de estudos. Esta entrada descreve a distribuição como metodologia e não estabelece pontos de corte diagnósticos para indivíduos.
History
A curva em sino surgiu no século XVIII a partir da aproximação de de Moivre à distribuição binomial e foi desenvolvida por Laplace e Gauss, este último utilizando-a na análise de erros de medição, razão pela qual é frequentemente chamada de distribuição gaussiana. Ao longo dos séculos XIX e XX, tornou-se o modelo padrão para quantidades biológicas medidas e a pedra angular da inferência estatística clássica.
Debates
- Quando a suposição de normalidade pode levar a equívocos?
- Muitas variáveis biológicas são assimétricas em vez de simétricas, e tratá-las como normais pode distorcer intervalos de referência e testes; a decisão de transformar os dados, usar métodos não paramétricos ou confiar no teorema do limite central para médias é um julgamento metodológico recorrente.
Key figures
- Carl Friedrich Gauss
- Pierre-Simon Laplace
- Abraham de Moivre
Related topics
Seminal works
- altman-bland-1995-normal
- rosner-2015
Frequently asked questions
- O que é a regra 68-95-99,7?
- Para uma distribuição normal, cerca de 68% dos valores estão dentro de um desvio padrão da média, cerca de 95% dentro de dois e cerca de 99,7% dentro de três; esta regra empírica conecta o desvio padrão diretamente à proporção de valores abrangidos.
- Os dados precisam ser normalmente distribuídos para usar a distribuição normal na inferência?
- Nem sempre; muitos métodos dependem da distribuição amostral de uma média ser aproximadamente normal pelo teorema do limite central, o que pode ocorrer mesmo quando as medições individuais não são normalmente distribuídas, desde que a amostra seja suficientemente grande.