Correlação e Covariância
A covariância mede como duas variáveis variam em conjunto, e a correlação reescala essa variação conjunta para um coeficiente entre -1 e +1 que capta a força e a direção da sua associação linear sem depender das unidades de medida. A correlação é uma das primeiras ferramentas utilizadas para descrever a relação entre duas quantidades contínuas na pesquisa em saúde.
Definition
A covariância é o produto médio dos desvios de duas variáveis em relação às suas médias; a correlação é a covariância dividida pelo produto dos dois desvios padrão, resultando num coeficiente adimensional entre -1 e +1 que quantifica a força e a direção da sua associação linear.
Scope
Este verbete aborda a covariância e a sua forma padronizada, o coeficiente de correlação de Pearson, a correlação de Spearman baseada em postos para associação monotónica, e as advertências comuns: a correlação descreve associação em vez de causalidade, reflete apenas relações lineares (ou monotónicas), e é distinta da concordância. É um tópico metodológico, não uma orientação clínica.
Core questions
- Como a variação conjunta de duas variáveis é resumida num único número?
- O que significa um coeficiente de correlação de um dado tamanho, e o que indica o seu sinal?
- Quando deve ser utilizado um coeficiente baseado em postos (Spearman) em vez de um coeficiente de Pearson?
- Por que a correlação não implica causalidade, e por que não é o mesmo que concordância?
Key concepts
- Covariância
- Coeficiente de correlação de Pearson
- Correlação de postos de Spearman
- Padronização e medição sem unidades
- Associação linear versus monotónica
- Correlação não é causalidade
- Correlação versus concordância
Mechanisms
A covariância acumula os produtos dos desvios emparelhados da média de cada variável; é positiva quando valores altos de uma variável tendem a acompanhar valores altos da outra e negativa quando se movem em direções opostas, mas a sua magnitude depende das unidades. A divisão pelos dois desvios padrão remove as unidades e limita o resultado entre -1 e +1, produzindo o coeficiente de correlação de Pearson, que capta a associação estritamente linear. Quando a relação é monotónica, mas não linear, ou os dados são ordinais ou não normais, utiliza-se o coeficiente de Spearman — o coeficiente de Pearson aplicado aos postos. Uma correlação próxima de zero indica a ausência de associação linear, mas não exclui uma relação não linear.
Clinical relevance
Os coeficientes de correlação são rotineiramente relatados quando os investigadores descrevem como duas medições clínicas se movem em conjunto. Uma advertência fundamental na avaliação é que uma alta correlação entre dois métodos de medição não significa que eles concordam, uma vez que dois instrumentos podem ser fortemente correlacionados, mas diferir sistematicamente; a concordância é avaliada por outras abordagens, como a análise dos limites de concordância. Este verbete descreve o método e não é uma base para decisões clínicas individuais.
Evidence & guidelines
Textos padrão de estatística médica e a série Statistics Notes no BMJ estabelecem como a correlação deve ser relatada e interpretada, incluindo a distinção entre correlação e concordância que motivou a abordagem dos limites de concordância de Bland-Altman para estudos de comparação de métodos.
History
O coeficiente de correlação surgiu do trabalho de Francis Galton sobre hereditariedade e foi formalizado por Karl Pearson no final do século XIX. Charles Spearman introduziu o coeficiente baseado em postos em 1904 para situações em que apenas a ordenação dos valores é fiável. No final do século XX, Bland e Altman estabeleceram uma distinção nítida e influente entre correlação e concordância, remodelando a forma como os estudos de comparação de métodos são analisados.
Debates
- Uma alta correlação demonstra que dois métodos de medição concordam?
- Não: dois métodos podem ser altamente correlacionados, mas diferir sistematicamente, portanto, a correlação é uma medida inadequada de concordância. Bland e Altman defenderam a análise dos limites de concordância, uma posição agora padrão em estudos de comparação de métodos.
Key figures
- Francis Galton
- Karl Pearson
- Charles Spearman
- Douglas Altman
- Martin Bland
Related topics
Seminal works
- spearman-1904
- bland-altman-1986
Frequently asked questions
- Qual é a diferença entre covariância e correlação?
- A covariância mede como duas variáveis variam em conjunto, mas o seu tamanho depende das suas unidades, por isso é difícil de interpretar diretamente. A correlação padroniza a covariância pelos dois desvios padrão, produzindo um coeficiente adimensional entre -1 e +1 que é comparável entre variáveis.
- Quando deve ser utilizada a correlação de Spearman em vez da de Pearson?
- A correlação de Spearman, que funciona com postos, é preferida quando a relação é monotónica, mas não linear, quando os dados são ordinais, ou quando valores atípicos ou distribuições não normais distorceriam o coeficiente de Pearson.