뉴클레오타이드 다양성과 변이 분류
뉴클레오타이드 다양성은 모집단에서 무작위로 선택된 두 염기서열이 평균적으로 얼마나 다른지를 측정하는 반면, 변이 분류는 단일 뉴클레오타이드 치환, 작은 삽입 및 결실, 그리고 더 큰 구조적 변화와 같은 다양한 종류의 DNA 차이를 일관된 용어로 정리합니다. 이 둘은 게놈이 얼마나 많은 변이를 가지고 있는지, 그리고 그 변이가 어떤 형태인지를 함께 설명합니다.
Definition
뉴클레오타이드 다양성(일반적으로 파이(pi)로 표기)은 모집단에서 추출된 두 염기서열 간의 부위당 평균 뉴클레오타이드 차이 수이며, 변이 분류는 관찰된 염기서열 차이(예: 단일 뉴클레오타이드 변이, 인델(indel), 구조적 변이)를 체계적으로 분류하는 것입니다.
Scope
이 항목은 집단 내 염기서열 변이의 표준 요약 측정치, 특히 뉴클레오타이드 다양성과 분리 부위(segregating sites)의 수, 그리고 크기 및 염기서열에 대한 예측된 영향에 따른 변이 유형 분류를 다룹니다. 이는 기술적이고 방법론적인 개념으로 다루어지며, 특정 변이에 임상적 중요성을 부여하지 않습니다.
Core questions
- 샘플에서 염기서열 변이의 양은 어떻게 요약됩니까?
- 뉴클레오타이드 다양성과 분리 부위의 수는 추정치로서 어떻게 다릅니까?
- 크기와 유형에 따른 유전 변이의 주요 분류는 무엇입니까?
- 표준 파일 형식에서 변이는 어떻게 표현되고 교환됩니까?
Key concepts
- 뉴클레오타이드 다양성(pi)
- 분리 부위(Segregating sites) 및 와터슨의 세타(Watterson's theta)
- 단일 뉴클레오타이드 변이(SNV/SNP)
- 삽입-결실(indel)
- 구조적 변이
- 참조 및 대체 대립유전자
- 변이 호출 형식(VCF)
Key theories
- 무한 부위 모델(Infinite-sites model) 및 세타(theta)
- 무한 부위 가정 하에서 각 새로운 돌연변이는 이전에 돌연변이가 발생하지 않은 부위에 발생하므로, 집단 돌연변이 매개변수 세타는 분리 부위의 수(와터슨의 추정치) 또는 평균 쌍별 차이(뉴클레오타이드 다양성) 중 하나로부터 추정될 수 있습니다. 이 둘 사이의 체계적인 불일치는 중립성으로부터의 이탈에 대한 정보를 제공합니다.
Mechanisms
변이는 먼저 염기서열 분석된 리드(reads)를 참조 게놈에 정렬하고 다른 위치를 식별함으로써 감지됩니다. 그런 다음 차이점은 크기와 형태로 분류됩니다. 요약 통계는 이를 집단 수준 측정치로 압축합니다. 분리 부위의 수는 와터슨의 세타(theta) 추정치의 기반이 되며, 평균 쌍별 차이는 뉴클레오타이드 다양성을 정의합니다. 둘 다 중립적이고 일정한 크기 모델에서 동일한 매개변수를 추정하기 때문에, 이들의 차이(타지마(Tajima)에 의해 공식화됨)는 인구통계학적 변화 또는 선택을 나타냅니다. 변이 호출 형식(Variant Call Format)의 표준화된 표현은 변이를 연구 전반에 걸쳐 저장, 공유 및 비교할 수 있도록 합니다.
Clinical relevance
일관된 변이 용어와 신뢰할 수 있는 다양성 추정치는 건강 환경에서 게놈 데이터를 해석하기 위한 전제 조건입니다. 왜냐하면 염기서열 분석된 게놈이 임상적으로 관련된 변이에 대해 스크리닝될 때 동일한 기술적 범주가 사용되기 때문입니다. 이 항목은 변이가 어떻게 기술되고 계산되는지를 설명하며, 개별 진단 또는 치료 결정의 근거가 아닙니다.
Evidence & guidelines
염기서열 다양성의 기초적인 추정치는 와터슨(Watterson)과 타지마(Tajima)에 의해 확립되었으며, 초기 인간 SNP 지도 및 1000 게놈 프로젝트 참조와 같은 대규모 조사는 인간 변이의 경험적 규모를 제공합니다. 변이 호출 형식(Variant Call Format)과 그 도구는 분류된 변이를 표현하기 위한 사실상의 커뮤니티 표준입니다.
History
초기 분자 집단 유전학은 알로자임(allozyme) 및 제한 효소 부위 조사를 통해, 그 다음에는 DNA 염기서열 분석을 통해 변이를 정량화했습니다. 와터슨의 1975년 연구와 타지마의 1989년 연구는 오늘날에도 사용되는 추정치를 제공했으며, 2001년 인간 SNP 지도와 이후의 염기서열 분석 컨소시엄은 변이 목록 작성을 게놈 전체 규모의 사업으로 전환시켰고, 그 결과로 생성된 변이를 표현하기 위한 VCF와 같은 표준 형식이 동반되었습니다.
Key figures
- G. A. Watterson
- Fumio Tajima
- Richard Durbin
- Gonçalo Abecasis
Related topics
Seminal works
- watterson-1975
- tajima-1989
- snp-map-2001
Frequently asked questions
- 뉴클레오타이드 다양성과 분리 부위의 수의 차이점은 무엇입니까?
- 분리 부위의 수는 샘플에서 얼마나 많은 위치가 변이하는지를 세는 반면, 뉴클레오타이드 다양성은 염기서열 쌍 간의 차이를 평균합니다. 둘 다 단순 중립 모델 하에서 동일한 기본 매개변수를 추정하며, 이들의 불일치 자체가 정보를 제공합니다.
- SNP는 돌연변이와 같은 것입니까?
- SNP는 집단에서 분리되어 관찰되는 단일 뉴클레오타이드 변이입니다. 이는 점 돌연변이에서 유래하지만, 이 용어는 변이가 한 개체에서 새로 발생한 변화라기보다는 상당한 빈도로 존재한다는 점을 강조합니다.