구조 유전체학 및 구조 변이
구조 변이는 DNA 세그먼트(일반적으로 단일 염기 변화보다 큼)가 삭제, 복제, 삽입, 역위 또는 전위되어 게놈의 복제 수, 방향 또는 위치를 변경하는 유전적 차이의 한 종류입니다. 이 분야가 발전한 염색체 이상과 함께, 구조 변이는 두 인간 게놈 간에 다른 염기쌍의 큰 부분을 차지하며 정상적인 변이와 질병 모두에 상당한 기여를 합니다.
Definition
구조 변이는 DNA 세그먼트에 영향을 미치는 게놈 변화를 포함합니다. 일반적으로 약 1킬로베이스(kb) 이상이지만, 현재는 더 작은 규모도 탐지 가능합니다. 여기에는 결실, 중복, 복제 수 변이, 삽입, 역위 및 전위가 포함되며, 단일 뉴클레오타이드 및 짧은 인델(indel) 변이의 보완적인 개념으로 간주됩니다.
Scope
이 영역은 독자에게 단일 뉴클레오타이드가 아닌 세그먼트 규모에서 게놈이 어떻게 변이하는지 알려줍니다. 여기에는 복제 수 변이(copy-number variants)를 탐지하고 분류하는 운영 필수 요소, 구조 변이 유형의 목록 및 이를 생성하는 돌연변이 메커니즘, 특정 게놈 영역을 반복적인 재배열에 취약하게 만드는 반복 구조(분절 중복), 게놈을 적극적으로 재구성하는 이동 요소, 그리고 변이의 개체군 수준 조직화가 포함됩니다. 이는 임상 지침이 아닌 참조 지향적인 내용입니다.
Sub-topics
Core questions
- 어떤 유형의 구조 변이가 존재하며, 어떤 메커니즘으로 발생하는가?
- 게놈 데이터에서 복제 수 및 구조 변이는 어떻게 탐지, 크기 측정 및 분류되는가?
- 게놈 구조의 어떤 특징이 특정 영역을 반복적인 재배열에 취약하게 만드는가?
- 구조 변이는 개체군 전반에 걸쳐 어떻게 분포하며, 일배체형(haplotype) 구조와 어떤 관련이 있는가?
Key concepts
- 구조 변이 (SV)
- 복제 수 변이 (CNV)
- 균형 재배열 vs. 불균형 재배열
- 반복 변이 vs. 비반복 변이
- 분절 중복 및 게놈 구조
- 이동 요소 삽입
- 일배체형(Haplotype) 및 연관 불균형(linkage disequilibrium)
Mechanisms
구조 변이는 여러 가지 광범위한 경로를 통해 발생합니다. 재조합 기반 메커니즘(주로 분절 중복과 같이 매우 유사한 반복 복제본 간의 비대립유전자 상동 재조합)은 공유된 절단점을 가진 반복적인 결실과 중복을 생성합니다. 복제 기반 메커니즘(포크 정지 및 주형 전환, 미세상동성 매개 파손 유도 복제 포함)은 비반복적이고 종종 복잡한 재배열을 생성합니다. 비상동 말단 연결(non-homologous end joining)은 이중 가닥 파손을 복구하여 서열을 삭제하거나 삽입할 수 있으며, 역전사(retrotransposition)는 이동 요소를 새로운 위치에 복사합니다. 이러한 과정은 복제 수, 서열 방향 또는 게놈 위치를 변경하며, 그 흔적은 시퀀싱 및 어레이 데이터에서 읽어 변이를 탐지하고 분류하는 데 사용됩니다.
Clinical relevance
구조 변이는 게놈 구조에 의해 매개되는 반복적인 미세결실 및 미세중복 증후군부터 암의 체세포 재배열에 이르기까지 유전 질환의 상당 부분을 차지합니다. 이러한 변이가 어떻게 탐지되고 분류되는지 이해하는 것은 보건 과학에서 게놈 발견을 해석하는 데 기초가 됩니다. 이 영역은 구조 변이가 어떻게 개념화되고 측정되는지를 설명하며, 개별적인 진단 또는 치료 결정의 근거가 아닙니다.
Epidemiology
대규모 참조 프로젝트는 구조 변이가 단일 뉴클레오타이드 변이보다 훨씬 적은 수에도 불구하고 게놈 간의 총 염기쌍 차이에 더 많은 영향을 미친다는 것을 보여주었습니다. 1000 Genomes 구조 변이 지도는 수천 명의 개인으로부터 수만 개의 구조 변이를 분류하여 기본 빈도와 인간 조상 전반에 걸친 결실, 중복 및 이동 요소 삽입의 상대적 풍부도를 확립했습니다.
History
대규모 게놈 변화에 대한 연구는 세포유전학 및 가시적인 염색체 이상 인식을 시작으로 이루어졌습니다. 2000년대의 어레이 기반 및 시퀀싱 기술은 미세 현미경적 복제 수 및 구조 변이가 건강한 개인들 사이에서도 널리 퍼져 있음을 밝혀냈으며, 이는 구조 변이를 희귀한 병리학적 사건이 아닌 게놈의 일상적인 구성 요소로 재정의했습니다. HapMap 및 1000 Genomes 프로젝트와 집중적인 구조 변이 연구에서 얻은 참조 목록은 이러한 변이를 인구 수준에서 이해하는 데 기여했습니다.
Debates
- 짧은 읽기 시퀀싱(short-read sequencing)이 구조 변이를 얼마나 완벽하게 포착할 수 있는가?
- 짧은 읽기 데이터는 결실과 많은 복제 수 변화를 잘 탐지하지만, 삽입, 역위, 그리고 반복적이거나 중복된 영역에 내장된 변이를 체계적으로 놓칩니다. 긴 읽기 및 어셈블리 기반 방법이 보편적으로 적용될 때까지 구조 변이 지형의 얼마나 많은 부분이 숨겨져 있는지에 대한 논쟁이 계속되고 있습니다.
Key figures
- Stephen W. Scherer
- Evan E. Eichler
- James R. Lupski
- Charles Lee
- Matthew Hurles
Related topics
Seminal works
- feuk-2006
- alkan-2011
- sudmant-2015
- 1000genomes-2015
Frequently asked questions
- 구조 변이는 단일 뉴클레오타이드 변이와 어떻게 다른가?
- 단일 뉴클레오타이드 변이는 하나의 염기를 변경하는 반면, 구조 변이는 DNA의 전체 세그먼트를 변경합니다(삭제, 복제, 삽입, 역위 또는 재배치). 따라서 한 번에 많은 염기에 영향을 미치며 다른 방법으로 탐지됩니다.
- 구조 변이는 항상 해로운가?
- 아닙니다. 대부분의 구조 변이는 건강한 사람들이 가지고 있는 흔한 다형성(polymorphism)이며, 용량 민감성 유전자(dosage-sensitive genes) 또는 특정 게놈 영역과 관련된 일부만이 질병과 연관되어 있습니다.