유전체 시퀀싱 및 어셈블리
유전체를 해독하는 것은 수십억 개의 염기 서열을 결정하는 것을 의미하며, 시퀀싱 장비는 이를 짧은 조각으로만 수행하므로, 소프트웨어가 이 조각들의 겹치는 부분을 찾아 전체 서열을 재구성합니다.
Definition
유전체 시퀀싱은 유기체 DNA의 뉴클레오타이드 순서를 실험적으로 결정하는 것이며, 어셈블리는 시퀀서가 생성하는 많은 짧은 리드로부터 완전한 서열을 계산적으로 재구성하는 것입니다.
Scope
이 주제는 Sanger 디데옥시 시퀀싱, 차세대 및 장문독 시퀀싱의 원리, 전유전체 샷건 및 클론 기반 전략, 리드를 컨티그 및 스캐폴드로 계산적으로 어셈블리하는 방법, 커버리지 및 연속성과 같은 어셈블리 품질 측정, 그리고 결과적으로 생성되는 참조 유전체를 다룹니다. 유전체 서열이 어떻게 결정되는지를 다루며, 해당 서열의 해석은 인접 주제에서 다룹니다.
Core questions
- Sanger 시퀀싱은 사슬 종결제를 사용하여 염기 순서를 어떻게 결정합니까?
- 차세대 및 장문독 시퀀싱이 더 빠르고 저렴한 이유는 무엇이며, 그 장단점은 무엇입니까?
- 수백만 개의 겹치는 리드가 염색체로 어떻게 어셈블리됩니까?
- 커버리지 및 연속성 측정은 어셈블리의 품질에 대해 무엇을 알려줍니까?
Key concepts
- Sanger 디데옥시 시퀀싱
- 차세대 및 장문독 시퀀싱
- 전유전체 샷건 전략
- 리드 어셈블리: 컨티그 및 스캐폴드
- 커버리지, 연속성 및 참조 유전체
Mechanisms
Sanger 시퀀싱은 사슬 종결 디데옥시뉴클레오타이드를 사용하여 서열을 나타내는 길이의 단편 사다리를 생성합니다. 대규모 병렬 플랫폼은 수백만 개의 단편을 동시에 읽으며, 어셈블리 소프트웨어는 리드 간의 겹침을 감지하여 이를 컨티그로 병합하고, 각 염색체를 따라 스캐폴드로 순서화하고 방향을 지정합니다.
Clinical relevance
저렴한 시퀀싱 덕분에 전유전체 및 엑솜 시퀀싱은 희귀 유전 질환 진단, 종양 프로파일링, 병원체 식별 및 신생아 선별 검사에 일상적으로 사용되어, 서열 결정이 획기적인 프로젝트에서 표준 실험실 검사로 전환되었습니다.
History
Sanger는 1977년에 사슬 종결 시퀀싱을 도입했으며, 인간 유전체 프로젝트는 2001년에 클론별 및 샷건 전략을 적용하여 인간 유전체 초안 서열을 생성했습니다. 2000년대 중반에 차세대 시퀀싱이 등장하고 이어서 장문독 플랫폼이 개발되면서 인간 유전체 시퀀싱 비용이 수십억 달러에서 수백 달러 수준으로 감소했습니다.
Key figures
- Frederick Sanger
- Eric Lander
- Craig Venter
Related topics
Seminal works
- sanger1977
- lander2001
Frequently asked questions
- 유전체를 단순히 통째로 읽는 것이 아니라 어셈블리해야 하는 이유는 무엇입니까?
- 시퀀싱 장비는 한 번에 짧은 DNA 조각만 읽을 수 있으므로, 유전체는 수많은 단편으로 분해됩니다. 그런 다음 어셈블리 소프트웨어는 단편이 겹치는 부분을 감지하여 원래 순서를 재구성합니다.
- 시퀀싱 커버리지란 무엇을 의미합니까?
- 커버리지는 유전체의 각 염기가 평균적으로 읽히는 횟수입니다. 커버리지가 높을수록 각 호출에 대한 신뢰도가 높아지고, 실제 변이를 시퀀싱 오류와 구별하는 데 도움이 됩니다.