희귀 변이 발굴 및 부담 검정
표준 GWAS는 일반적인 변이를 탐지하는 데 적합하지만, 게놈의 기능적 변이 중 상당수는 희귀합니다. 단일 희귀 변이는 너무 적은 수의 사람에게서 나타나 개별적으로 신뢰성 있게 검정하기 어렵기 때문에, 희귀 변이 분석은 변이들을—일반적으로 유전자 내에서—집계하여, 그들의 결합된 부담이 환자군과 대조군 간에 차이가 있는지 검정합니다. 시퀀싱 기술은 이러한 변이들을 관찰 가능하게 만들었으며, 부담 검정 및 커널 검정과 같은 방법들은 이를 통계적으로 다룰 수 있게 했습니다.
Definition
희귀 변이 발굴은 일반적으로 시퀀싱을 통해 특성과 관련된 저빈도 유전 변이를 식별하는 것이며, 부담 검정은 단일 마커 분석에는 없는 검정력을 얻기 위해 여러 희귀 변이를 단일 검정으로 집계하는 유전자 또는 영역 기반 방법들의 한 종류입니다.
Scope
이 주제는 희귀 변이가 왜 기존의 단일 마커 GWAS를 벗어나는지, 이를 밝혀내는 시퀀싱 기술과 참조 패널, 그리고 주요 집계 전략들—단순 부담(collapsing) 검정, SKAT와 같은 분산 성분 커널 검정, SKAT-O와 같은 결합 또는 최적 검정—을 다룹니다. 또한, 어떤 변이를 집계할지 결정하는 데 있어 변이 주석(annotation)의 역할도 언급합니다. 이는 방법론에 대한 참고 자료이며, 임상적 지침은 아닙니다.
Core questions
- 기존의 단일 마커 GWAS는 왜 희귀 변이에 대한 검정력이 부족한가요?
- 어레이 유전자형 분석이 아닌 시퀀싱은 어떻게 희귀 변이를 밝혀내나요?
- 부담(collapsing) 검정은 유전자 내의 희귀 변이를 어떻게 집계하나요?
- SKAT와 같은 커널 기반 검정은 단순 부담 검정과 어떻게 다른가요?
- 변이들이 동일한 방향으로 작용한다고 가정하는 경우는 언제이며, 그렇지 않을 때는 어떻게 되나요?
Key concepts
- 희귀 및 저빈도 변이
- 전체 엑솜 및 전체 게놈 시퀀싱
- 유전자 또는 영역 기반 집계
- 부담 / 콜랩싱 검정
- 시퀀스 커널 연관성 검정 (SKAT)
- 결합 및 최적 검정 (SKAT-O)
- 기능적 주석 및 변이 가중치
Mechanisms
단일 마커 연관성 검정은 변이가 소수의 개인에게서만 발견될 때 검정력을 잃기 때문에, 희귀 변이 방법은 유전자 또는 영역에 걸쳐 변이들을 집계합니다. 부담(collapsing) 검정은 단위 내의 희귀 변이들을 단일 개수 또는 지표로 요약하고, 그 부담이 환자군과 대조군 간에 차이가 있는지 검정합니다. 이 방법은 대부분의 변이가 동일한 방향으로 특성에 영향을 미칠 때 강력하지만, 효과의 방향이 혼합되어 있거나 많은 변이가 중립적일 때는 검정력을 잃습니다. Sequence Kernel Association Test (SKAT)로 대표되는 분산 성분 커널 검정은 공통된 방향을 가정하지 않고 변이 효과의 분포가 영가설에서 벗어나는지 검정하며, 효과가 이질적일 때도 강력합니다. SKAT-O와 같은 결합된 접근 방식은 부담 검정과 커널 검정을 적응적으로 혼합하여 다양한 시나리오에서 잘 수행됩니다. 집계는 어떤 변이를 포함할지 선택하는 것에 의존하기 때문에, 기능적 주석과 빈도 기반 가중치가 그럴듯하게 해로운 변이에 초점을 맞추는 데 사용됩니다. 시퀀싱과 1000 Genomes Project와 같은 다양한 참조 패널은 이러한 검정들이 분석하는 희귀 변이의 발굴 및 주석의 기반이 됩니다.
Clinical relevance
희귀 변이 방법은 유전적 발굴을 기능적일 가능성이 더 높고 근본적인 생물학에 더 가까운 변이로 확장하여, 일반 변이 GWAS를 보완합니다. 이 주제는 분석 방법을 설명하며, 개별 변이 해석, 진단 또는 치료 결정의 근거가 아닙니다.
Evidence & guidelines
방법론적 근거는 임상 지침보다는 통계 유전학 문헌에서 나옵니다. Wu et al. (2011)은 시퀀싱 데이터에 대한 SKAT를 소개했습니다. Lee et al. (2012)은 최적의 결합 검정(SKAT-O)을 개발했습니다. 1000 Genomes Project (2015)는 희귀 변이에 대한 참조 데이터를 제공했습니다. Manolio et al. (2009)은 희귀 변이를 일반 변이 GWAS로 설명되지 않는 유전율의 한 가지 후보 원천으로 제시했습니다.
History
일반 변이 GWAS가 성숙하고 유전율을 설명하지 못하게 되면서, 어레이로는 포착할 수 없는 희귀 변이에 관심이 쏠렸습니다. 2010년경 저렴한 엑솜 및 게놈 시퀀싱의 확산으로 희귀 변이를 대규모로 관찰할 수 있게 되었고, 이어서 단순 콜랩싱 검정, 2011년 SKAT와 같은 분산 성분 커널 검정, 2012년 SKAT-O와 같은 적응형 조합 등 일련의 집계 방법들이 등장했습니다. 이후 대규모 시퀀싱 컨소시엄과 바이오뱅크 엑솜 연구는 이러한 방법들을 광범위하게 적용했지만, 희귀 변이 신호를 탐지하는 데는 여전히 매우 큰 샘플이 필요합니다.
Debates
- 언제 커널 검정보다 부담 검정을 선호해야 하는가?
- 부담 검정은 집계된 변이들이 일관된 방향으로 작용할 때 가장 강력하며, SKAT와 같은 커널 검정은 혼합된 효과 방향과 많은 중립 변이에 더 강건합니다. 결합 검정은 위험을 분산시키려 하지만, 올바른 선택은 유전자의 알려지지 않은 실제 구조에 달려 있습니다.
Key figures
- Xihong Lin
- Michael Wu
- Seunggeun Lee
- Michael Boehnke
- Teri Manolio
Related topics
Seminal works
- wu-2011
- lee-2012
- manolio-2009
Frequently asked questions
- GWAS는 왜 희귀 변이를 한 번에 하나씩 검정할 수 없나요?
- 소수의 개인에게서만 발견되는 변이는 신뢰할 수 있는 단일 마커 검정을 위한 통계적 정보가 너무 적기 때문에, 희귀 변이 방법은 검정력을 얻기 위해 많은 변이들을—일반적으로 유전자 내에서—집계합니다.
- SKAT는 단순 부담 검정과 어떻게 다른가요?
- 부담 검정은 집계된 변이들이 대부분 동일한 방향으로 작용한다고 가정하는 반면, SKAT는 변이 효과가 방향이나 크기에서 다르더라도 영가설로부터의 이탈을 탐지하는 분산 성분 검정으로, 이질적인 효과에 더 강건합니다.