혼합 및 혈통 추론 방법
혼합 및 혈통 추론 방법은 개인의 유전자형으로부터 서로 다른 조상 원천 집단에서 유래한 유전체 비율을 추정하고, 과거에 집단 간에 유전자 교환이 있었는지 여부를 검증합니다. 이 방법들은 대립유전자 공유 패턴을 혈통 및 집단 혼합에 대한 정량적 진술로 전환합니다.
Definition
혈통 추론은 유전체 데이터로부터 개인 유전체의 조상 원천을 추정하는 것이며, 혼합 추론은 특히 뚜렷한 조상 집단에 의해 기여된 비율을 추정하고 그들 간의 역사적 유전자 흐름을 검정합니다.
Scope
이 항목은 모델 기반 군집화 및 혈통 비율 추정, 차원 축소 접근법, 그리고 혼합에 대한 공식적인 검정 방법과 이러한 방법들이 의존하는 가정들을 다룹니다. 이는 방법론적 주제이며, 유전적 혈통의 통계적 추론을 설명하고 혈통 범주에 대한 임상적 또는 사회적 주장을 하지 않습니다.
Core questions
- 유전자형 데이터로부터 혈통 비율은 어떻게 추정됩니까?
- 모델 기반 군집화와 주성분 접근법은 어떻게 다릅니까?
- 집단 간의 과거 유전자 흐름은 어떻게 공식적으로 검정됩니까?
- 혈통 추정치에 어떤 가정과 한계가 영향을 미칩니까?
Key concepts
- 혈통 비율
- 모델 기반 군집화 (STRUCTURE/ADMIXTURE)
- 원천 집단 수 (K)
- 주성분 분석
- f-통계량 및 혼합 검정
- 혈통 참조 패널
Key theories
- 모델 기반 혈통 혼합
- 각 개인의 유전체는 뚜렷한 대립유전자 빈도를 가진 K개의 조상 집단에서 추출된 혼합으로 모델링됩니다. 가능도 또는 베이즈 기반 방법은 조상 대립유전자 빈도와 각 개인의 혈통 비율을 공동으로 추정하여 구조의 확률적 분해를 제공합니다.
Mechanisms
모델 기반 방법은 각 유전체를 K개의 조상 집단으로부터의 혼합으로 간주하고, 가능도 또는 베이즈 추론을 통해 조상 대립유전자 빈도와 각 개인의 혼합 비율을 모두 추정합니다. 효율적인 최대 가능도 구현은 이를 유전체 규모에서 실현 가능하게 만들었습니다. 보완적인 접근법은 주성분 분석을 사용하여 사전에 집단을 지정하지 않고 개인을 저차원 혈통 공간에 배치합니다. f-통계량에 기반한 공식적인 혼합 검정은 집단 간의 대립유전자 공유 패턴을 비교하여 역사적 유전자 흐름을 감지하고 정량화합니다. 이 모든 방법은 적절한 참조 집단과 원천 집단 수의 선택에 의존합니다.
Clinical relevance
혈통 추론은 유전 연구에서 집단 구조를 올바르게 처리하고 유전체 결과를 해석할 때 혈통이 일치하는 참조 데이터를 적절하게 사용하는 데 도움이 됩니다. 이 항목은 유전적 혈통을 추정하는 데 사용되는 통계적 방법을 설명하며, 개별 진단 또는 치료 결정의 근거가 되거나 유전적 혈통을 사회적 정체성과 동일시하는 근거가 아닙니다.
Evidence & guidelines
모델 기반 혈통 추정은 STRUCTURE 프레임워크에 의해 확립되었고 최대 가능도 구현에 의해 확장 가능해졌으며, 주성분 방법과 f-통계량 혼합 검정은 보완적이고 널리 사용되는 접근법을 제공합니다. 전 세계 인간 변이체에 대한 전장 유전체 조사는 집단 전반에 걸친 이들의 적용을 보여줍니다.
History
다중 유전자형의 모델 기반 군집화는 2000년경에 도입되어 집단 구조를 설명하는 표준이 되었으며, 전장 유전체 데이터가 증가함에 따라 더 빠른 최대 가능도 구현이 뒤따랐습니다. 주성분 방법은 2000년대 중반에 혈통 추론에 적용되었고, f-통계량 프레임워크는 고대 혼합에 대한 검정을 공식화하여 혈통 및 혼합 추론을 집단 유전체학의 핵심 도구로 만들었습니다.
Debates
- 원천 집단 수 (K)는 어떻게 선택되고 해석되어야 하는가?
- 모델 기반 방법은 K를 지정하거나 선택해야 하지만, 추론된 군집은 통계적 구성물이며 그 해석은 샘플링과 K에 따라 달라집니다. 이를 자연적이고 이산적인 집단으로 취급하는 것은 오해의 소지가 있을 수 있습니다.
Key figures
- Jonathan Pritchard
- John Novembre
- David Reich
- Nick Patterson
Related topics
Seminal works
- pritchard-2000
- alexander-2009
- patterson-2012
Frequently asked questions
- 예를 들어, 한 집단으로부터의 혈통 비율이 30%라는 것은 무엇을 의미합니까?
- 이는 해당 개인의 유전체 약 30%가 추론된 조상 원천의 대립유전자 빈도로 가장 잘 설명된다는 모델 기반 추정치입니다. 이는 고정된 생물학적 분류가 아니라 선택된 참조 집단에 대한 통계적 분해입니다.
- 집단 간의 혼합은 어떻게 감지됩니까?
- f-통계량에 기반한 공식적인 검정은 여러 집단 간의 공유 변이 패턴을 비교합니다. 유전자 흐름이 없었을 경우 예상되는 것과의 편차는 혼합이 발생했음을 시사하는 증거를 제공합니다.