Referans Genom Standartları ve Anotasyonu
Referans genom, bir tür için küratörlüğü yapılmış, temsili bir konsensüs dizisidir ve yeni dizi verilerinin hizalandığı ve yorumlandığı ortak bir koordinat sistemi olarak hizmet etmektedir. Bu genomun sürümlü yapılar (builds) halinde sürdürülmesi ve üzerine biyolojik anotasyonun eklenmesi, genomik sonuçların çalışmalar, laboratuvarlar ve zaman içinde karşılaştırılabilir olmasını sağlamaktadır.
Tanım
Referans genom, bir türün genomunu temsil etmek üzere seçilen, küratörlüğü yapılmış bir konsensüs nükleotit dizisidir; sürümlü derlemeler (yapılar) halinde sürdürülmekte ve genlerin ve diğer fonksiyonel elementlerin konumları ile anotasyon yapılmakta olup, genomik verilerin hizalanması ve yorumlanması için stabil bir koordinat çerçevesi sağlamaktadır.
Kapsam
Bu madde, referans derlemesinin ne olduğunu, ardışık yapılar (insan GRCh38 derlemesi ve telomerden telomere derlemesi gibi) halinde nasıl sürümlendirildiğini, genleri ve fonksiyonel özellikleri işaretlemede anotasyonun rolünü ve daha eksiksiz ve temsili referanslara doğru ilerlemeyi kapsamaktadır. Bu, klinik bir rehberlik değil, bir referans ve altyapısal bir konudur.
Temel sorular
- Referans genom nedir ve alan neden tek bir referans genom üzerinde standartlaşmaktadır?
- Referans derlemeleri ardışık yapılar halinde nasıl ve neden sürümlendirilmektedir?
- Genom anotasyonu, bir referans dizisine ne katmaktadır?
Anahtar kavramlar
- Referans derlemesi (konsensüs dizisi)
- Genom yapısı ve sürümlendirme (örn. GRCh38)
- Genom anotasyonu
- Hizalama için koordinat sistemi
- Telomerden telomere (boşluksuz) derleme
- Derleme boşlukları ve tamamlama
Mekanizmalar
Bir referans genom, yüksek kaliteli dizi verilerinden, tek bir bireyi değil, türü temsil eden bir konsensüs halinde birleştirilmektedir. Daha sonra, genomik koordinatların stabil ve atıf yapılabilir kalması için sürümlü bir yapı olarak yayınlanmaktadır. Anotasyon, diziyi genlerin, transkriptlerin, düzenleyici ve tekrarlayıcı elementlerin konumlarıyla örtüştürerek, ham koordinatları biyolojik olarak yorumlanabilir haritalara dönüştürmektedir. Ardışık yapılar düzeltmeleri içermekte, boşlukları doldurmakta ve temsili iyileştirmektedir; insan referansı, 2001 taslak ve 2004 tamamlanmış ökromatik diziden GRCh38 yapısına ve nihayetinde daha önce erişilemeyen bölgeleri çözen eksiksiz bir telomerden telomere derlemesine doğru ilerlemiştir.
Klinik önem
Varyant çağrısı ve yorumlaması referans koordinatlarında ifade edildiğinden, referans genomun seçimi ve sürümü, genomik bulguların nasıl raporlandığını ve karşılaştırıldığını doğrudan etkilemektedir. Bu madde, referans altyapısını eğitim materyali olarak tanımlamakta olup, bireysel klinik veya tanısal kararlar için bir temel teşkil etmemektedir.
Kanıt ve kılavuzlar
Referans, klinik kılavuzlardan ziyade konsorsiyum birincil raporları ve derleme değerlendirmeleri aracılığıyla belgelenmektedir: başlangıç taslağı (2001) ve tamamlanmış ökromatik dizi (2004), GRCh38 yapısının değerlendirilmesi (Schneider ve diğerleri, 2017) ve eksiksiz telomerden telomere insan genomu (Nurk ve diğerleri, 2022), mevcut standardı ve gidişatını tanımlamaktadır.
Tarihçe
İnsan referans genomu, 2001 taslak dizisi ve 2004 tamamlanmış ökromatik dizisi ile başlamış, ardından Genom Referans Konsorsiyumu tarafından GRCh38 ile sonuçlanan ardışık yapılar boyunca sürdürülmüş ve iyileştirilmiştir. Tekrarlayıcı ve sentromerik bölgelerdeki kalıcı boşluklar, 2022'de ilk eksiksiz, boşluksuz insan genomunu üreten ve bir referans standardının ne olabileceğini yeniden şekillendiren telomerden telomere konsorsiyumu tarafından nihayet kapatılmıştır.
Öne çıkan isimler
- Deanna Church
- Valerie Schneider
- Adam Phillippy
- Karen Miga
İlgili konular
Temel eserler
- ihgsc-2004
- schneider-2017
- nurk-2022-ref
Sıkça sorulan sorular
- Bir referans genomun neden farklı sürümleri veya yapıları bulunmaktadır?
- Dizi analizi ve derleme iyileştikçe, referans hataları düzeltmek, boşlukları kapatmak ve türü daha iyi temsil etmek için revize edilmektedir; her sürüm, genomik koordinatların stabil kalması ve sonuçların karşılaştırılabilir olması için bir yapı sürümü almaktadır.
- Genom anotasyonu nedir?
- Anotasyon, genlerin, transkriptlerin, düzenleyici elementlerin ve diğer özelliklerin referans dizisi üzerinde nerede bulunduğunu işaretleme sürecidir; bir nükleotit dizisini biyolojik olarak yorumlanabilir bir haritaya dönüştürmektedir.