Medidas de Variabilidade
As medidas de variabilidade, ou dispersão, quantificam o quão espalhado um conjunto de observações está em torno de seu centro. Dois conjuntos de dados podem ter a mesma média, mas diferir muito na forma como seus valores se agrupam, e medidas como a amplitude, a variância, o desvio padrão e o intervalo interquartil capturam essa diferença.
Definition
Uma medida de variabilidade quantifica a dispersão das observações em torno de um valor central: a amplitude é a diferença entre os valores maior e menor, a variância é o desvio quadrático médio da média, o desvio padrão é sua raiz quadrada nas unidades originais, e o intervalo interquartil é a dispersão da metade central dos dados ordenados.
Scope
Esta entrada aborda as principais medidas de dispersão — amplitude, variância, desvio padrão e intervalo interquartil — e como cada uma é calculada e interpretada. Ela distingue o desvio padrão do erro padrão e é uma referência metodológica, não uma orientação clínica.
Core questions
- Quão amplamente as observações se espalham em torno de seu centro?
- Qual medida de dispersão se emparelha apropriadamente com a medida de localização escolhida?
- Como o desvio padrão difere do erro padrão?
Key concepts
- Amplitude
- Variância
- Desvio padrão
- Intervalo interquartil
- Coeficiente de variação
- Desvio padrão versus erro padrão
- Emparelhamento de dispersão com tendência central
Mechanisms
A amplitude, a diferença entre os extremos, é simples, mas instável, porque depende de apenas dois valores e aumenta com o tamanho da amostra. A variância calcula a média dos desvios quadrados das observações em relação à média, e o desvio padrão retorna essa quantidade às unidades de medida originais, tornando-o o companheiro natural da média para dados aproximadamente simétricos. O intervalo interquartil, que abrange do 25º ao 75º percentil, descreve a metade central dos dados e é robusto a valores atípicos (outliers), tornando-o o companheiro da mediana para distribuições assimétricas. Uma fonte recorrente de confusão é a diferença entre o desvio padrão, que descreve a dispersão de observações individuais, e o erro padrão, que descreve a precisão de uma estimativa, como a média, e diminui à medida que a amostra cresce.
Clinical relevance
As medidas de dispersão informam aos leitores o quão variável uma medida ou resultado é, o que é importante para julgar a consistência, os intervalos de referência e a precisão das estimativas relatadas. Esta entrada descreve como a variabilidade é resumida para avaliação e não é uma base para decisões individuais de diagnóstico ou tratamento.
Epidemiology
Relatar a variabilidade juntamente com a tendência central é uma expectativa básica na pesquisa em saúde, e a distinção entre desvio padrão e erro padrão é um erro comum de relato: confundi-los pode fazer com que as estimativas pareçam mais ou menos precisas do que realmente são. O intervalo interquartil é preferido quando os dados são assimétricos.
History
A variância e o desvio padrão foram formalizados no final do século XIX e início do século XX, com o termo desvio padrão introduzido por Karl Pearson e a estrutura analítica da variância desenvolvida por Ronald Fisher. O intervalo interquartil, robusto e baseado em quantis, ganhou destaque com o surgimento da análise exploratória de dados e do box plot no século XX.
Debates
- Desvio padrão ou erro padrão no relato?
- Os autores frequentemente relatam o erro padrão em vez do desvio padrão porque é numericamente menor, o que pode enganar os leitores sobre a variabilidade das observações subjacentes; as diretrizes metodológicas enfatizam o relato do desvio padrão para descrever a dispersão e a reserva do erro padrão para a precisão das estimativas.
Key figures
- Douglas G. Altman
- J. Martin Bland
- S. Manikandan
Related topics
Seminal works
- manikandan-2011-dispersion
- altman-bland-2005
Frequently asked questions
- Qual é a diferença entre o desvio padrão e o erro padrão?
- O desvio padrão descreve o quanto as observações individuais variam em torno da média, enquanto o erro padrão descreve a precisão com que a própria média é estimada. O erro padrão diminui à medida que o tamanho da amostra aumenta; o desvio padrão não.
- Quando o intervalo interquartil deve ser usado em vez do desvio padrão?
- Quando os dados são assimétricos ou contêm valores atípicos (outliers), o intervalo interquartil descreve a dispersão de forma mais fiel porque, assim como a mediana, ele não é afetado por valores extremos.