जीनोमिक वेरिएंट का कार्यात्मक एनोटेशन
एक जीनोम के अनुक्रमण से लाखों वेरिएंट प्राप्त होते हैं, लेकिन अधिकांश के परिणाम अज्ञात होते हैं। कार्यात्मक एनोटेशन प्रत्येक वेरिएंट को जैविक अर्थ प्रदान करने की प्रक्रिया है - यह कहाँ स्थित है, यह किस जीन या नियामक तत्व को प्रभावित करता है, और यह कार्य को कितनी संभावना से बदल सकता है - ताकि उन कुछ वेरिएंट को पहचाना जा सके जो महत्वपूर्ण हैं, उन कई वेरिएंट से जो महत्वपूर्ण नहीं हैं।
Definition
जीनोमिक वेरिएंट का कार्यात्मक एनोटेशन अनुक्रम वेरिएंट को जैविक संदर्भ और अनुमानित कार्यात्मक परिणाम प्रदान करना है, जिसमें उनकी जीनोमिक स्थिति, प्रभावित जीन या नियामक तत्व, आणविक प्रभाव (जैसे मिससेंस, नॉनसेंस, स्प्लिस-अल्टरिंग, या नियामक), और कार्य पर अनुमानित प्रभाव शामिल है।
Scope
यह विषय एकल-न्यूक्लियोटाइड वेरिएंट, इंसर्शन, डिलीशन और संरचनात्मक परिवर्तनों के एनोटेशन को शामिल करता है: वेरिएंट को जीन और नियामक क्षेत्रों के सापेक्ष खोजना, उनके आणविक परिणाम को वर्गीकृत करना, और कोडिंग और गैर-कोडिंग स्थलों के लिए हानिकारक होने की भविष्यवाणी करना। यह एनोटेशन को एक पद्धतिगत और संदर्भ विषय के रूप में मानता है और व्यक्तिगत नैदानिक मामलों के लिए वेरिएंट की व्याख्या प्रदान नहीं करता है।
Core questions
- एक वेरिएंट जीन, एक्सॉन, स्प्लिस साइट्स और नियामक तत्वों के सापेक्ष कहाँ स्थित है?
- इसका आणविक परिणाम क्या है - क्या यह एक प्रोटीन को बदलता है, स्प्लिसिंग को बाधित करता है, या विनियमन को प्रभावित करता है?
- कार्य के लिए वेरिएंट के हानिकारक होने की कितनी संभावना है?
- गैर-कोडिंग वेरिएंट की व्याख्या कैसे की जा सकती है, जिनमें एक साधारण प्रोटीन-परिवर्तनकारी रीडआउट की कमी होती है?
Key concepts
- वेरिएंट स्थान और परिणाम वर्गीकरण
- मिससेंस, नॉनसेंस, फ्रेमशिफ्ट और स्प्लिस वेरिएंट
- कोडिंग वेरिएंट के लिए हानिकारक होने की भविष्यवाणी
- गैर-कोडिंग और नियामक वेरिएंट एनोटेशन
- संदर्भ एनोटेशन स्रोत (जीन मॉडल, संरक्षण, कार्यात्मक तत्व मानचित्र)
- अभिव्यक्ति मात्रात्मक विशेषता लोकस (eQTLs)
Mechanisms
एनोटेशन पाइपलाइनें पहले प्रत्येक वेरिएंट को एक संदर्भ जीनोम और जीन मॉडल के एक सेट पर मैप करती हैं ताकि उसकी स्थिति और मूल परिणाम निर्धारित किया जा सके - कि क्या यह एक कोडिंग एक्सॉन, एक स्प्लिस साइट, एक अनट्रांसलेटेड क्षेत्र, या एक इंटरजेनिक क्षेत्र में स्थित है - ANNOVAR और SnpEff जैसे उपकरणों का उपयोग करके। कोडिंग वेरिएंट के लिए जो एक अमीनो एसिड को बदलते हैं, SIFT जैसे भविष्यवाणी एल्गोरिदम अनुमान लगाते हैं कि प्रतिस्थापन सहन किया जाता है या हानिकारक है, प्रजातियों में अनुक्रम संरक्षण पर आधारित है। गैर-कोडिंग वेरिएंट की व्याख्या करना अधिक कठिन है क्योंकि वे एक प्रोटीन को नहीं बदलते हैं; यहाँ एनोटेशन ENCODE जैसे कार्यात्मक तत्वों के मानचित्रों और GTEx जैसे परियोजनाओं द्वारा सूचीबद्ध आनुवंशिक वेरिएंट और जीन अभिव्यक्ति (eQTLs) के बीच के लिंक पर निर्भर करता है। आउटपुट प्रत्येक वेरिएंट का एक स्तरित विवरण है जो डाउनस्ट्रीम प्राथमिकता का समर्थन करता है।
Clinical relevance
वेरिएंट एनोटेशन जीनोमिक अनुसंधान और अनुक्रमण डेटा की व्याख्या के लिए उपयोग की जाने वाली विश्लेषणात्मक पाइपलाइनों में एक मूलभूत कदम है। यह बताता है कि उम्मीदवार वेरिएंट को कैसे चित्रित और प्राथमिकता दी जाती है; इसके द्वारा उत्पन्न भविष्यवाणियां कम्प्यूटेशनल परिकल्पनाएं हैं और अपने आप में रोगजनकता का निर्धारण या व्यक्तिगत नैदानिक या उपचार निर्णयों का आधार नहीं हैं।
History
जैसे-जैसे उच्च-थ्रूपुट अनुक्रमण ने 2000 के दशक के अंत में पूरे-एक्सोम और पूरे-जीनोम डेटा को नियमित बना दिया, बाधा वेरिएंट उत्पन्न करने से उनकी व्याख्या करने में स्थानांतरित हो गई। SIFT (2009) जैसे संरक्षण-आधारित भविष्यवक्ताओं ने कोडिंग वेरिएंट को संबोधित किया, जबकि ANNOVAR (2010) और SnpEff (2012) जैसे सामान्य एनोटेशन इंजनों ने वेरिएंट प्रकारों में परिणाम के असाइनमेंट को व्यवस्थित किया। ENCODE (2012) जैसे बड़े कार्यात्मक-तत्व कैटलॉग और GTEx (2015) जैसे अभिव्यक्ति संसाधनों ने फिर गैर-कोडिंग जीनोम तक व्याख्या का विस्तार किया, जो अधिकांश भिन्नता बनाता है।
Debates
- गैर-कोडिंग वेरिएंट की व्याख्या कैसे की जानी चाहिए?
- कोडिंग वेरिएंट में अपेक्षाकृत व्याख्या योग्य आणविक रीडआउट होता है, लेकिन अधिकांश भिन्नता गैर-कोडिंग होती है और इसमें प्रत्यक्ष प्रोटीन परिणाम की कमी होती है; इसकी व्याख्या कार्यात्मक-तत्व मानचित्रों और eQTL साक्ष्य पर निर्भर करती है जिनकी पूर्णता और ऊतक विशिष्टता सीमित बनी हुई है।
Key figures
- Kai Wang
- Pauline Ng
- Steven Henikoff
- Pablo Cingolani
Related topics
Seminal works
- kumar-2009
- wang-2010
- cingolani-2012
- encode-2012
Frequently asked questions
- एक वेरिएंट को एनोटेट करने का क्या अर्थ है?
- इसका अर्थ है वेरिएंट को जैविक संदर्भ प्रदान करना: यह जीन और नियामक तत्वों के सापेक्ष कहाँ स्थित है, इसका क्या आणविक परिणाम है, और यह कार्य को कितनी संभावना से प्रभावित कर सकता है - ताकि महत्वपूर्ण वेरिएंट को तटस्थ लोगों से अलग किया जा सके।
- गैर-कोडिंग वेरिएंट को कोडिंग वेरिएंट की तुलना में एनोटेट करना अधिक कठिन क्यों है?
- कोडिंग वेरिएंट को आनुवंशिक कोड के विरुद्ध पढ़ा जा सकता है ताकि प्रोटीन परिवर्तन की भविष्यवाणी की जा सके, लेकिन गैर-कोडिंग वेरिएंट में ऐसा कोई प्रत्यक्ष रीडआउट नहीं होता है; उनकी व्याख्या नियामक तत्वों के मानचित्रों और वेरिएंट और जीन अभिव्यक्ति के बीच के लिंक पर निर्भर करती है, जो अभी भी अधूरे हैं।