पाथवे एनरिचमेंट और नेटवर्क विश्लेषण
एक जीनोमिक प्रयोग अक्सर दर्जनों या सैकड़ों जीनों की सूची के साथ समाप्त होता है - एक-एक करके व्याख्या करने के लिए बहुत अधिक। पाथवे एनरिचमेंट विश्लेषण एक अधिक सटीक प्रश्न पूछता है: इस जीन सूची को देखते हुए, क्या कोई ज्ञात जैविक पाथवे या प्रक्रियाएं संयोग से अपेक्षित से अधिक प्रतिनिधित्व करती हैं? यह जीन सूची से जैविक व्याख्या तक का मानक मार्ग है।
Definition
पाथवे एनरिचमेंट विश्लेषण सांख्यिकीय विधियों का एक परिवार है जो यह परीक्षण करता है कि क्या परिभाषित जैविक पाथवे या जीन सेट से जुड़े जीन एक प्रयोग द्वारा निहित जीनों के बीच अति-प्रतिनिधित्व करते हैं, या तो एक चयनित सूची के भीतर (अति-प्रतिनिधित्व विश्लेषण) या एक लगातार रैंक की गई सूची में (जीन सेट एनरिचमेंट विश्लेषण)।
Scope
यह विषय एनरिचमेंट विधियों के दो मुख्य परिवारों को शामिल करता है - एक चयनित जीन सूची पर अति-प्रतिनिधित्व विश्लेषण और पूरी तरह से रैंक की गई सूची में जीन सेट एनरिचमेंट - साथ ही वे क्यूरेटेड पाथवे संसाधन जिन पर वे आधारित हैं और सांख्यिकीय कमियाँ जो उनकी वैधता को प्रभावित करती हैं। यह एक पद्धतिगत संदर्भ है और परिणामों की नैदानिक व्याख्या प्रदान नहीं करता है।
Core questions
- जीनों की एक सूची को देखते हुए, कौन से पाथवे या प्रक्रियाएं सांख्यिकीय रूप से अति-प्रतिनिधित्व करती हैं?
- रैंकिंग-आधारित एनरिचमेंट थ्रेशोल्ड-आधारित अति-प्रतिनिधित्व से कैसे भिन्न है?
- किस पृष्ठभूमि (संदर्भ) जीन सेट के विरुद्ध एक परीक्षण का मूल्यांकन किया जाना चाहिए?
- एकाधिक-परीक्षण और लंबाई या चयन पूर्वाग्रहों को कैसे नियंत्रित किया जाता है?
Key concepts
- अति-प्रतिनिधित्व विश्लेषण (ORA)
- जीन सेट एनरिचमेंट विश्लेषण (GSEA)
- जीन सेट और पाथवे डेटाबेस (KEGG, Reactome, GO पद)
- पृष्ठभूमि या संदर्भ जीन सेट
- एकाधिक-परीक्षण सुधार
- RNA-seq एनरिचमेंट में चयन और लंबाई पूर्वाग्रह
Mechanisms
अति-प्रतिनिधित्व विश्लेषण एक सीमा द्वारा पहले से चयनित जीनों की एक सूची लेता है - उदाहरण के लिए, वे जीन जिन्हें विभेदक रूप से व्यक्त किया गया कहा जाता है - और पूछता है, आमतौर पर एक हाइपरजियोमेट्रिक या फिशर के सटीक परीक्षण के साथ, कि क्या किसी पाथवे में पृष्ठभूमि को देखते हुए अपेक्षित से अधिक जीन शामिल हैं। जीन सेट एनरिचमेंट विश्लेषण इसके बजाय जीनों की पूरी रैंक की गई सूची का उपयोग करता है और परीक्षण करता है कि क्या एक पाथवे के सदस्य रैंकिंग के शीर्ष या निचले भाग की ओर क्लस्टर करने की प्रवृत्ति रखते हैं, जिससे एक कठोर सीमा चुनने की आवश्यकता से बचा जा सके। दोनों जीन ओन्टोलॉजी, KEGG और Reactome जैसे संसाधनों से प्राप्त क्यूरेटेड जीन सेट पर निर्भर करते हैं। वैधता एक उपयुक्त पृष्ठभूमि चुनने और परीक्षण किए गए कई पाथवे के लिए सुधार करने पर निर्भर करती है; RNA-seq डेटा के लिए, विधियों को लंबे या अधिक व्यक्त किए गए जीनों के महत्वपूर्ण रूप से पता लगने की प्रवृत्ति को भी ध्यान में रखना चाहिए, एक चयन पूर्वाग्रह जिसे असंशोधित एनरिचमेंट परीक्षण जैविक संकेत के लिए गलत मान सकते हैं।
Clinical relevance
पाथवे एनरिचमेंट व्याख्यात्मक कदम है जो एक विभेदक-अभिव्यक्ति या भिन्न परिणाम को जैविक प्रक्रियाओं के बारे में एक कथन में बदल देता है, और इसका व्यापक रूप से अनुवादकीय जीनोमिक्स में यांत्रिक परिकल्पनाओं को उत्पन्न करने के लिए उपयोग किया जाता है। यह बताता है कि जीन-स्तरीय परिणामों को पाथवे स्तर पर कैसे संक्षेपित किया जाता है और इसे संदर्भ अभिविन्यास के रूप में अभिप्रेत किया जाता है, न कि व्यक्तिगत निदान या उपचार निर्णयों के आधार के रूप में।
History
प्रारंभिक कार्यात्मक व्याख्या ने गिना कि एक सूची से कितने जीन प्रत्येक एनोटेशन श्रेणी में आते हैं, जिसे DAVID जैसे अति-प्रतिनिधित्व उपकरणों में औपचारिक रूप दिया गया था। जीन सेट एनरिचमेंट विश्लेषण (2005) ने पूरी रैंक की गई जीन सूची के आसपास समस्या को फिर से तैयार किया, जो एक पाथवे में समन्वित, सूक्ष्म परिवर्तनों के प्रति अधिक संवेदनशील साबित हुआ। जैसे-जैसे RNA-seq ने माइक्रोएरे को प्रतिस्थापित किया, GOseq (2010) जैसी विधियों ने अनुक्रमण डेटा के लिए विशिष्ट लंबाई और गणना पूर्वाग्रहों को ठीक किया, और KEGG और Reactome सहित क्यूरेटेड पाथवे संसाधन मानक जीन-सेट इनपुट बन गए।
Debates
- अति-प्रतिनिधित्व बनाम रैंकिंग-आधारित एनरिचमेंट
- अति-प्रतिनिधित्व विश्लेषण के लिए एक महत्व सीमा की आवश्यकता होती है और इस प्रकार कट-ऑफ से नीचे की जानकारी को छोड़ देता है, जबकि जीन सेट एनरिचमेंट पूरी रैंकिंग का उपयोग करता है; प्रत्येक की अलग-अलग संवेदनशीलता और धारणाएं होती हैं, और चुनाव यह बदल सकता है कि कौन से पाथवे रिपोर्ट किए जाते हैं।
- अनुक्रमण डेटा से एनरिचमेंट में पूर्वाग्रह
- RNA-seq में, लंबे और अधिक व्यक्त किए गए जीनों के महत्वपूर्ण रूप से बुलाए जाने की अधिक संभावना होती है, इसलिए भोले एनरिचमेंट परीक्षण पाथवे को लंबे जीनों के लिए समृद्ध रिपोर्ट कर सकते हैं बजाय वास्तविक जीव विज्ञान के लिए जब तक कि इस चयन पूर्वाग्रह को ठीक नहीं किया जाता है।
Key figures
- Aravind Subramanian
- Jill Mesirov
- Da Wei Huang
- Minoru Kanehisa
Related topics
Seminal works
- subramanian-2005
- huang-2009
- kanehisa-2000
- young-2010
Frequently asked questions
- अति-प्रतिनिधित्व विश्लेषण और जीन सेट एनरिचमेंट विश्लेषण में क्या अंतर है?
- अति-प्रतिनिधित्व विश्लेषण पाथवे अति-प्रतिनिधित्व के लिए जीनों की एक पूर्व-चयनित सूची (उदाहरण के लिए, महत्व सीमा से ऊपर वाले) का परीक्षण करता है, जबकि जीन सेट एनरिचमेंट विश्लेषण जीनों की पूरी रैंक की गई सूची का उपयोग करता है और पूछता है कि क्या एक पाथवे के सदस्य रैंकिंग के चरम सीमाओं की ओर क्लस्टर करते हैं, जिससे एक कठोर कट-ऑफ से बचा जा सके।
- पृष्ठभूमि जीन सेट का चुनाव क्यों मायने रखता है?
- एनरिचमेंट का मूल्यांकन जीनों के एक संदर्भ सेट के सापेक्ष किया जाता है; एक अनुपयुक्त पृष्ठभूमि का उपयोग करना (उदाहरण के लिए, सभी जीन जब केवल एक उपसमूह का पता लगाया जा सकता था) पाथवे को सांख्यिकीय के बजाय जैविक कारणों से समृद्ध या कम दिखाई दे सकता है।
Methods for this concept
- Pathway Enrichment Analysis
- Gene Set Enrichment Analysis
- Bayesian Pathway Enrichment Analysis
- Network-based gene set enrichment analysis
- Differential pathway enrichment analysis
- Bayesian Gene Set Enrichment Analysis
- Network-based pathway enrichment analysis
- Machine learning-assisted pathway enrichment analysis