ScholarGate
Asistan

Genom Dizileme, Birleştirme ve Referans Standartları

Bu alan, bir genomdaki nükleotit dizisinin nasıl okunduğunu, ortaya çıkan fragmanların daha uzun bitişik diziler halinde nasıl yeniden yapılandırıldığını ve yeni verilerin ortak bir standarda göre hizalanabilmesi ve yorumlanabilmesi için derlenmiş referans genomların nasıl oluşturulduğunu ve sürdürüldüğünü kapsamaktadır. Bu adımlar bir araya geldiğinde, genomik biliminin neredeyse tamamının dayandığı teknik temeli oluşturmaktadır.

PaperMind ile konu bulYakındaMakale ve konu bul
Tools & resources
Slaytları indir
Learn & explore
VideoYakında

Tanım

Genom dizileme, bir organizmanın DNA'sındaki nükleotit sırasının belirlenmesidir; birleştirme (assembly) ise, örtüşen dizi okumalarının daha uzun bitişik diziler halinde hesaplamalı olarak yeniden yapılandırılmasıdır; referans standartları ise, yeni dizi verilerinin hizalandığı ve karşılaştırıldığı derlenmiş, sürümlendirilmiş genom birleştirmeleri ve açıklamalardır (annotasyonlardır).

Kapsam

Bu alan, Sanger dideoksi dizilemeden yüksek verimli kısa okuma ve uzun okuma platformlarına kadar dizileme kimyalarını, okumaların kontigler ve iskeleler (scaffold) halinde hesaplamalı olarak birleştirilmesini, GRCh38 ve telomerden telomere (telomere-to-telomere) birleştirme gibi referans genomların oluşturulmasını ve açıklanmasını (annotasyonunu) ve veri güvenilirliğini yöneten kalite kontrol ve hata düzeltme adımlarını kapsamaktadır. Bu konular metodolojik ve altyapısal başlıklar olarak ele alınmakta, klinik prosedürler olarak değerlendirilmemektedir.

Alt konular

Temel sorular

  • Bir genomun nükleotit sırası nasıl belirlenmektedir ve dizileme kimyaları nasıl evrilmiştir?
  • Kısa veya uzun dizi okumaları eksiksiz bir genoma nasıl yeniden yapılandırılmaktadır?
  • Bir genom birleştirmesini kullanılabilir bir referans yapan nedir ve nasıl sürümlendirilmekte ve açıklanmaktadır (annotasyon yapılmaktadır)?
  • Dizileme hataları nasıl tespit edilmekte, nicelleştirilmekte ve düzeltilmektedir ki sonraki analizler güvenilir olsun?

Anahtar kavramlar

  • Okuma (Read), kontig ve iskele (scaffold)
  • Kapsam (coverage) ve dizileme derinliği
  • Kısa okuma ve uzun okuma dizilemesi
  • De novo birleştirme ve referans güdümlü hizalama
  • Referans genom ve genom yapısı (build) (örn. GRCh38)
  • Genom açıklama (annotasyon)
  • Baz başına kalite (Phred) skoru

Mekanizmalar

Dizileme platformları, fiziksel DNA'yı, her biri bir kalite tahminiyle birlikte makine tarafından okunabilir baz çağrılarına dönüştürmektedir. Çoğu platform bir kromozomdan çok daha kısa fragmanları okuduğu için, bu fragmanların birleştirilmesi gerekmektedir: de novo birleştirme, genomu okuma örtüşmelerinden yeniden yapılandırmaktadır (tarihsel olarak örtüşme-düzen-konsensüs (overlap-layout-consensus) yöntemleri kullanılırken, günümüzde kısa okumalar için sıklıkla de Bruijn grafikleri kullanılmaktadır), referans güdümlü analiz ise okumaları mevcut bir birleştirmeye hizalamaktadır. Bir referans genom, alan için koordinat sistemi sağlayan, ardışık yapılar (builds) olarak sürümlendirilmiş ve açıklama (annotasyon) katmanlarıyla donatılmış, derlenmiş bir konsensüs dizisidir. Kalite kontrol ve hata düzeltme, tüm işlem hattı boyunca yer almakta, baz başına doğruluğu tahmin etmekte ve varyantlar çağrılmadan önce artefaktları gidermekte veya düzeltmektedir.

Klinik önem

Güvenilir dizileme, birleştirme ve referans standartları, varyant yorumlaması iyi karakterize edilmiş bir referansa hizalanmış doğru okumalara bağlı olduğundan, klinik ve araştırma genomik biliminin temelini oluşturmaktadır. Bu alan, genomik kanıt üreten altyapıyı tanımlamaktadır; bir referans ve eğitim materyali olup, bireysel tanı veya tedavi kararları için bir temel teşkil etmemektedir.

Kanıt ve kılavuzlar

Buradaki yöntemler, klinik kılavuzlardan ziyade dönüm noktası niteliğindeki birincil çalışmalar ve konsorsiyum raporları aracılığıyla belgelenmektedir: Sanger'in zincir sonlandırma yöntemi (1977), İnsan Genomu Projesi'nin taslağı (2001), yeni nesil platformlara ilişkin derlemeler (Metzker, 2010) ve telomerden telomere (telomere-to-telomere) tamamlanmış insan genomu (Nurk ve ark., 2022) alanın seyrini izlemektedir.

Tarihçe

DNA dizileme, 1977 yılında Sanger'in zincir sonlandırma kimyası ile başlamış, bu yöntem ilk genomların okunmasını sağlamış ve 2001 yılında İnsan Genomu Projesi'nin taslak dizisine güç vermiştir. Yüksek verimli (yeni nesil) platformların daha sonraki yükselişi, maliyetleri kat kat düşürmüş ve uzun okuma teknolojileri daha sonra tekrarlayan bölgeleri çözüme kavuşturarak, 2022 yılında ilk eksiksiz, boşluksuz insan genomunun elde edilmesiyle sonuçlanmıştır.

Öne çıkan isimler

  • Frederick Sanger
  • Eric Lander
  • Michael Metzker
  • Sergey Koren
  • Adam Phillippy

İlgili konular

Temel eserler

  • sanger-1977
  • ihgsc-2001
  • metzker-2009
  • nurk-2022

Sıkça sorulan sorular

Dizileme ve birleştirme (assembly) arasındaki fark nedir?
Dizileme, DNA fragmanlarındaki nükleotit sırasını okurken, birleştirme (assembly) bu fragmanları kontigler, iskeleler (scaffold) veya tüm kromozomlar gibi daha uzun, bitişik diziler halinde yeniden yapılandıran hesaplamalı adımdır.
Alan neden bir referans genoma ihtiyaç duymaktadır?
Bir referans genom, farklı bireylerden ve laboratuvarlardan gelen yeni dizi verilerinin tutarlı bir şekilde hizalanabilmesi, karşılaştırılabilmesi ve yorumlanabilmesi için ortak, sürümlendirilmiş bir koordinat sistemi sağlamaktadır.

Bu kavram için yöntemler

İlgili kavramlar