공분산과 상관관계
공분산은 두 변수가 함께 변하는 정도를 측정하며, 상관관계는 이러한 공동 변화를 -1과 +1 사이의 계수로 재조정하여 측정 단위에 의존하지 않고 선형 연관성의 강도와 방향을 포착합니다. 상관관계는 건강 연구에서 두 연속형 양 사이의 관계를 설명하는 데 사용되는 첫 번째 도구 중 하나입니다.
Definition
공분산은 두 변수의 평균으로부터의 편차 곱의 평균이며, 상관관계는 공분산을 두 표준편차의 곱으로 나눈 값으로, -1과 +1 사이의 단위 없는 계수를 산출하여 선형 연관성의 강도와 방향을 정량화합니다.
Scope
이 항목은 공분산과 그 표준화된 형태인 피어슨 곱-모멘트 상관계수, 단조 연관성을 위한 순위 기반 스피어만 상관계수, 그리고 일반적인 주의사항을 다룹니다. 상관관계는 인과관계가 아닌 연관성을 설명하며, 선형(또는 단조) 관계만을 반영하고, 일치도와는 다릅니다. 이는 방법론적 주제이며 임상적 지침이 아닙니다.
Core questions
- 두 변수의 공동 변화는 하나의 숫자로 어떻게 요약됩니까?
- 주어진 크기의 상관계수는 무엇을 의미하며, 그 부호는 무엇을 나타냅니까?
- 피어슨 계수 대신 순위 기반(스피어만) 계수를 언제 사용해야 합니까?
- 상관관계가 인과관계를 의미하지 않는 이유는 무엇이며, 일치도와 동일하지 않은 이유는 무엇입니까?
Key concepts
- 공분산
- 피어슨 곱-모멘트 상관계수
- 스피어만 순위 상관계수
- 표준화 및 단위 없는 측정
- 선형 대 단조 연관성
- 상관관계는 인과관계가 아니다
- 상관관계 대 일치도
Mechanisms
공분산은 각 변수의 평균으로부터의 쌍을 이룬 편차 곱을 누적합니다. 한 변수의 높은 값이 다른 변수의 높은 값과 동반되는 경향이 있을 때 양의 값을 가지며, 반대 방향으로 움직일 때 음의 값을 가지지만, 그 크기는 단위에 따라 달라집니다. 두 표준편차로 나누면 단위가 제거되고 결과가 -1과 +1 사이로 제한되어 엄격하게 선형적인 연관성을 포착하는 피어슨 상관계수가 생성됩니다. 관계가 단조롭지만 선형적이지 않거나, 데이터가 순서형이거나 비정규 분포일 때는 순위에 적용된 피어슨 계수인 스피어만 계수가 대신 사용됩니다. 상관관계가 0에 가까우면 선형 연관성이 없음을 나타내지만, 비선형 관계를 배제하지는 않습니다.
Clinical relevance
연구자들이 두 임상 측정값이 어떻게 함께 움직이는지 설명할 때 상관계수가 일상적으로 보고됩니다. 평가 시 중요한 주의사항은 두 측정 방법 간의 높은 상관관계가 그들이 일치한다는 것을 의미하지 않는다는 것입니다. 두 기기는 강하게 상관되어 있지만 체계적으로 다를 수 있기 때문입니다. 일치도는 일치도 한계 분석과 같은 다른 접근 방식으로 평가됩니다. 이 항목은 방법을 설명하며 개별 임상 결정의 근거가 아닙니다.
Evidence & guidelines
표준 의학 통계 교과서와 BMJ의 Statistics Notes 시리즈는 상관관계와 일치도의 구별을 포함하여 상관관계가 어떻게 보고되고 해석되어야 하는지를 제시하며, 이는 방법 비교 연구를 위한 Bland-Altman 일치도 한계 접근법의 동기가 되었습니다.
History
상관계수는 프랜시스 골턴(Francis Galton)의 유전 연구에서 발전했으며 19세기 말 칼 피어슨(Karl Pearson)에 의해 공식화되었습니다. 찰스 스피어만(Charles Spearman)은 값의 순서만이 신뢰할 수 있는 상황을 위해 1904년에 순위 기반 계수를 도입했습니다. 20세기 후반, 블랜드(Bland)와 알트만(Altman)은 상관관계와 일치도 사이의 날카롭고 영향력 있는 구별을 제시하여 방법 비교 연구가 분석되는 방식을 재편했습니다.
Debates
- 높은 상관관계가 두 측정 방법이 일치함을 증명합니까?
- 아닙니다. 두 방법은 체계적으로 다르면서도 높은 상관관계를 가질 수 있으므로, 상관관계는 일치도를 측정하는 부적절한 척도입니다. 블랜드와 알트만은 대신 일치도 한계 분석을 주장했으며, 이는 현재 방법 비교 연구에서 표준적인 입장입니다.
Key figures
- Francis Galton
- Karl Pearson
- Charles Spearman
- Douglas Altman
- Martin Bland
Related topics
Seminal works
- spearman-1904
- bland-altman-1986
Frequently asked questions
- 공분산과 상관관계의 차이점은 무엇입니까?
- 공분산은 두 변수가 함께 변하는 정도를 측정하지만, 그 크기는 단위에 따라 달라 직접 해석하기 어렵습니다. 상관관계는 두 표준편차로 공분산을 표준화하여 -1과 +1 사이의 단위 없는 계수를 생성하며, 이는 변수 간에 비교 가능합니다.
- 피어슨 상관계수 대신 스피어만 상관계수를 언제 사용해야 합니까?
- 순위에 기반한 스피어만 상관계수는 관계가 단조롭지만 선형적이지 않을 때, 데이터가 순서형일 때, 또는 이상치나 비정규 분포가 피어슨 계수를 왜곡할 수 있을 때 선호됩니다.