Yol Zenginleştirme ve Ağ Analizi
Bir genomik deney genellikle düzinelerce veya yüzlerce genin bir listesiyle sonuçlanır — bu, tek tek yorumlamak için çok fazladır. Yol zenginleştirme analizi daha keskin bir soru sorar: Bu gen listesi verildiğinde, bilinen herhangi bir biyolojik yol veya sürecin şans eseri beklenenden daha fazla temsil edilip edilmediği. Bu, bir gen listesinden biyolojik bir yoruma ulaşmanın standart yoludur.
Tanım
Yol zenginleştirme analizi, tanımlanmış biyolojik yollara veya gen kümelerine eklenmiş genlerin, bir deneyle ilişkilendirilen genler arasında, seçilmiş bir liste içinde (aşırı temsil analizi) veya sürekli sıralanmış bir liste boyunca (gen kümesi zenginleştirme analizi) aşırı temsil edilip edilmediğini test eden istatistiksel yöntemler ailesidir.
Kapsam
Bu konu, zenginleştirme yöntemlerinin iki ana ailesini — seçilmiş bir gen listesi üzerindeki aşırı temsil analizi ve tam sıralanmış bir liste üzerindeki gen kümesi zenginleştirmesi — ve bunların dayandığı küratörlü yol kaynaklarını, ayrıca geçerliliklerini etkileyen istatistiksel tuzakları kapsamaktadır. Bu, metodolojik bir referanstır ve sonuçların klinik yorumunu sağlamaz.
Temel sorular
- Bir gen listesi verildiğinde, hangi yollar veya süreçler istatistiksel olarak aşırı temsil edilmektedir?
- Sıralama tabanlı zenginleştirme, eşik tabanlı aşırı temsilden nasıl farklılaşır?
- Bir test hangi arka plan (referans) gen kümesine karşı değerlendirilmelidir?
- Çoklu test ve uzunluk veya seçim yanlılıkları nasıl kontrol edilir?
Anahtar kavramlar
- Aşırı temsil analizi (ORA)
- Gen kümesi zenginleştirme analizi (GSEA)
- Gen kümeleri ve yol veritabanları (KEGG, Reactome, GO terimleri)
- Arka plan veya referans gen kümesi
- Çoklu test düzeltmesi
- RNA-seq zenginleştirmesinde seçim ve uzunluk yanlılığı
Mekanizmalar
Aşırı temsil analizi, önceden bir eşik tarafından seçilmiş bir gen listesini — örneğin, diferansiyel olarak ifade edildiği belirlenen genleri — alır ve tipik olarak hipergeometrik veya Fisher'ın kesin testi ile, herhangi bir yolun arka plan göz önüne alındığında beklenenden daha fazla bu genleri içerip içermediğini sorar. Gen kümesi zenginleştirme analizi ise, genlerin tüm sıralanmış listesini kullanır ve bir yolun üyelerinin sıralamanın üst veya alt kısmına doğru kümelenme eğiliminde olup olmadığını test eder, böylece kesin bir eşik seçme ihtiyacını ortadan kaldırır. Her ikisi de Gen Ontolojisi, KEGG ve Reactome gibi kaynaklardan alınan küratörlü gen kümelerine dayanır. Geçerlilik, uygun bir arka plan seçimine ve test edilen birçok yol için düzeltme yapılmasına bağlıdır; RNA-seq verileri için, yöntemler ayrıca daha uzun veya daha yüksek düzeyde ifade edilen genlerin anlamlı olarak tespit edilme eğilimini de hesaba katmalıdır, bu, düzeltilmemiş zenginleştirme testlerinin biyolojik sinyal olarak yanlış yorumlayabileceği bir seçim yanlılığıdır.
Klinik önem
Yol zenginleştirme, diferansiyel ifade veya varyant sonucunu biyolojik süreçler hakkında bir ifadeye dönüştüren yorumlayıcı adımdır ve translasyonel genomikte mekanistik hipotezler üretmek için yaygın olarak kullanılmaktadır. Gen düzeyindeki sonuçların yol düzeyinde nasıl özetlendiğini açıklar ve bireysel tanı veya tedavi kararları için bir temel olarak değil, referans yönlendirme olarak tasarlanmıştır.
Tarihçe
Erken fonksiyonel yorumlama, bir listedeki kaç genin her bir açıklama kategorisine girdiğini sayıyordu ve bu, DAVID gibi aşırı temsil araçlarında resmileştirildi. Gen kümesi zenginleştirme analizi (2005), sorunu tam sıralanmış gen listesi etrafında yeniden çerçeveledi ve bu, bir yol boyunca koordineli, ince değişikliklere karşı daha hassas olduğunu kanıtladı. RNA-seq, mikroarraylerin yerini aldıkça, GOseq (2010) gibi yöntemler, dizileme verilerine özgü uzunluk ve sayım yanlılıklarını düzeltti ve KEGG ve Reactome dahil olmak üzere küratörlü yol kaynakları standart gen kümesi girdileri haline geldi.
Tartışmalar
- Aşırı temsil ve sıralama tabanlı zenginleştirme
- Aşırı temsil analizi bir anlamlılık eşiği gerektirir ve bu nedenle kesme noktasının altındaki bilgiyi göz ardı ederken, gen kümesi zenginleştirmesi tüm sıralamayı kullanır; her birinin farklı hassasiyetleri ve varsayımları vardır ve seçim, hangi yolların raporlandığını değiştirebilir.
- Dizileme verilerinden kaynaklanan zenginleştirme yanlılığı
- RNA-seq'de, daha uzun ve daha yüksek düzeyde ifade edilen genlerin anlamlı olarak adlandırılma olasılığı daha yüksektir, bu nedenle bu seçim yanlılığı düzeltilmediği sürece naif zenginleştirme testleri, gerçek biyoloji yerine uzun genler açısından zenginleşmiş yolları rapor edebilir.
Öne çıkan isimler
- Aravind Subramanian
- Jill Mesirov
- Da Wei Huang
- Minoru Kanehisa
İlgili konular
Temel eserler
- subramanian-2005
- huang-2009
- kanehisa-2000
- young-2010
Sıkça sorulan sorular
- Aşırı temsil analizi ile gen kümesi zenginleştirme analizi arasındaki fark nedir?
- Aşırı temsil analizi, önceden seçilmiş bir gen listesini (örneğin, bir anlamlılık eşiğinin üzerindeki genler) yol aşırı temsili açısından test ederken, gen kümesi zenginleştirme analizi genlerin tüm sıralanmış listesini kullanır ve bir yolun üyelerinin sıralamanın uç noktalarına doğru kümelenip kümelenmediğini sorar, böylece kesin bir kesme noktasından kaçınılır.
- Arka plan gen kümesi seçiminin önemi nedir?
- Zenginleştirme, bir referans gen kümesine göre değerlendirilir; uygun olmayan bir arka plan kullanmak (örneğin, yalnızca bir alt kümesinin tespit edilebildiği durumlarda tüm genleri kullanmak), yolların biyolojik nedenlerden ziyade istatistiksel nedenlerle zenginleşmiş veya tükenmiş görünmesine neden olabilir.
Bu kavram için yöntemler
- Pathway Enrichment Analysis
- Gene Set Enrichment Analysis
- Bayesian Pathway Enrichment Analysis
- Network-based gene set enrichment analysis
- Differential pathway enrichment analysis
- Bayesian Gene Set Enrichment Analysis
- Network-based pathway enrichment analysis
- Machine learning-assisted pathway enrichment analysis