인구 계층화와 인간 유전적 다양성
인간의 유전적 다양성은 구조화되어 있습니다. 즉, 대립유전자 빈도는 지리 및 혈통에 따라 일정한 방식으로 달라지므로, 인구는 단일하고 분리되지 않은 집단이 아니라 서로 구별됩니다. 인구 계층화는 이러한 구조와 사례군과 대조군이 혈통에서 체계적으로 다를 때 유전 연구에 도입될 수 있는 편향을 의미합니다.
Definition
인구 계층화는 표본 내 하위 집단 간에 뚜렷한 혈통에서 비롯된 대립유전자 빈도의 체계적인 차이가 존재하는 것을 의미합니다. 여기서 유전적 다양성은 인간 집단 내 및 집단 간에 이러한 변이가 어떻게 분할되는지를 나타냅니다.
Scope
이 항목은 인구 간 유전적 분화 측정, 전 세계 인간 다양성의 광범위한 패턴, 그리고 연관성 연구에서 교란 변수로서의 계층화 및 이를 탐지하고 수정하는 데 사용되는 방법을 다룹니다. 이는 방법론적이고 기술적인 주제이며, 인구 범주의 임상적 또는 사회적 해석을 피합니다.
Core questions
- 인구 간 유전적 분화는 어떻게 정량화되는가?
- 인간 유전적 변이는 인구 내와 인구 간에 어떻게 분할되는가?
- 인구 계층화는 유전적 연관성 연구에 어떻게 편향을 초래하는가?
- 계층화는 통계적으로 어떻게 탐지되고 수정되는가?
Key concepts
- F-통계량 및 FST
- 집단 내 vs 집단 간 다양성
- 거리별 고립
- 혈통의 주성분
- 연관성 연구에서의 교란
- 참조 인구 패널
Key theories
- F-통계량과 다양성의 분할
- Wright의 계층적 F-통계량은 Nei와 Weir 및 Cockerham에 의해 추정을 위해 공식화되었으며, 유전적 분산을 집단 내 및 집단 간 구성 요소로 분할합니다. FST는 집단 간 차이에 기인하는 전체 다양성의 비율을 요약하며, 분화의 표준 측정치입니다.
Mechanisms
유전적 부동(drift), 제한된 이주, 그리고 지역적 선택으로 인해 대립유전자 빈도가 집단 간에 발산하면서 분화가 축적됩니다. 집단 간 차이에 기인하는 전체 다양성의 비율은 FST로 포착됩니다. 인간의 경우, 대부분의 유전적 변이는 집단 내에 존재하며, 그중 더 작지만 구조화된 구성 요소는 지리에 따라 집단 간에 나타납니다. 연관성 연구에서, 혈통이 사례군과 대조군 간에 다르고 또한 대립유전자 빈도와 상관관계가 있다면, 허위 연관성이 발생합니다. 혈통을 요약하는 방법들, 특히 전장 유전체 유전자형의 주성분 분석은 이러한 계층화를 탐지하고 조정하는 데 사용됩니다.
Clinical relevance
인구 구조를 고려하는 것은 의학 지식에 정보를 제공하는 유전적 연관성 연구의 타당성에 필수적입니다. 왜냐하면 수정되지 않은 계층화는 잘못된 연관성을 생성할 수 있기 때문입니다. 다양성에 대한 인식은 또한 인구 간 유전체 연구 결과의 전이성에도 영향을 미칩니다. 이 항목은 인구 구조를 방법론적 고려 사항으로 설명하며, 개별 진단 또는 치료 결정의 근거가 아닙니다.
Evidence & guidelines
분화의 추정은 Nei의 유전자 다양성 분석과 Weir-Cockerham F-통계량에 기반하며, 전 세계 인간 변이의 전장 유전체 조사는 인간 다양성의 경험적 구조를 설명합니다. 주성분 보정은 연관성 연구에서 계층화를 다루는 표준 방법입니다.
History
Wright는 구조화된 인구를 설명하기 위해 F-통계량을 도입했으며, Nei와 이후 Weir 및 Cockerham은 실용적인 추정량을 제공했습니다. 인간 변이가 어떻게 분할되는지에 대한 논쟁은 1970년대 Lewontin의 연구로 거슬러 올라갑니다. 이후 전장 유전체 유전자형 분석은 전 세계 인간 관계를 상세하게 매핑했으며, 대규모 유전자형 데이터셋이 등장하면서 주성분 방법은 계층화를 제어하는 표준이 되었습니다.
Key figures
- Sewall Wright
- Masatoshi Nei
- Bruce Weir
- David Reich
- Alkes Price
Related topics
Seminal works
- nei-1973
- weir-cockerham-1984
- price-2006
Frequently asked questions
- FST는 실제로 무엇을 측정하는가?
- FST는 전체 유전적 다양성 중 집단 내 변이보다는 집단 간 대립유전자 빈도 차이로 인한 비율을 나타냅니다. 0에 가까운 값은 분화가 거의 없음을 나타내고, 값이 클수록 분화가 더 많음을 나타냅니다.
- 인구 계층화가 연관성 연구에서 문제가 되는 이유는 무엇인가?
- 사례군과 대조군 간에 다른 혈통의 비율이 다르고, 그 빈도가 혈통에 따라 달라지는 변이가 있다면, 해당 변이가 인과적 역할이 없더라도 특성과 연관된 것처럼 보일 수 있으므로, 계층화를 탐지하고 수정해야 합니다.