जीनोम अनुक्रमण, संयोजन और संदर्भ मानक
यह क्षेत्र बताता है कि जीनोम में न्यूक्लियोटाइड के क्रम को कैसे पढ़ा जाता है, परिणामी खंडों को लंबी सन्निहित अनुक्रमों में कैसे पुनर्निर्मित किया जाता है, और कैसे क्यूरेटेड संदर्भ जीनोम बनाए और अनुरक्षित किए जाते हैं ताकि नए डेटा को एक साझा मानक के विरुद्ध संरेखित और व्याख्या किया जा सके। ये सभी चरण मिलकर जीनोमिक्स के लगभग सभी तकनीकी आधार का निर्माण करते हैं।
Definition
जीनोम अनुक्रमण किसी जीव के डीएनए के न्यूक्लियोटाइड क्रम का निर्धारण है; संयोजन अतिव्यापी अनुक्रम रीड्स का लंबी सन्निहित अनुक्रमों में कम्प्यूटेशनल पुनर्निर्माण है; और संदर्भ मानक क्यूरेटेड, संस्करणित जीनोम संयोजन और एनोटेशन हैं जिनके विरुद्ध नए अनुक्रम डेटा को संरेखित और तुलना किया जाता है।
Scope
यह क्षेत्र सेंगर डिडॉक्सी अनुक्रमण से लेकर उच्च-थ्रूपुट शॉर्ट-रीड और लॉन्ग-रीड प्लेटफॉर्म तक के अनुक्रमण रसायन विज्ञान, रीड्स के कंटिग्स और स्कैफोल्ड्स में कम्प्यूटेशनल संयोजन, GRCh38 और टेलोमेयर-टू-टेलोमेयर संयोजन जैसे संदर्भ जीनोम का निर्माण और एनोटेशन, और डेटा विश्वसनीयता को नियंत्रित करने वाले गुणवत्ता-नियंत्रण और त्रुटि-सुधार चरणों तक फैला हुआ है। यह इन्हें कार्यप्रणाली और अवसंरचनात्मक विषयों के रूप में मानता है, न कि नैदानिक प्रक्रियाओं के रूप में।
Sub-topics
Core questions
- जीनोम के न्यूक्लियोटाइड क्रम का निर्धारण कैसे किया जाता है, और अनुक्रमण रसायन विज्ञान कैसे विकसित हुआ है?
- शॉर्ट या लॉन्ग अनुक्रम रीड्स को एक पूर्ण जीनोम में कैसे पुनर्निर्मित किया जाता है?
- एक जीनोम संयोजन को एक उपयोगी संदर्भ क्या बनाता है, और इसे कैसे संस्करणित और एनोटेट किया जाता है?
- अनुक्रमण त्रुटियों का पता कैसे लगाया जाता है, मात्रा निर्धारित की जाती है और उन्हें कैसे ठीक किया जाता है ताकि डाउनस्ट्रीम विश्लेषण विश्वसनीय हों?
Key concepts
- रीड, कंटिग और स्कैफोल्ड
- कवरेज और अनुक्रमण गहराई
- शॉर्ट-रीड बनाम लॉन्ग-रीड अनुक्रमण
- डी नोवो संयोजन बनाम संदर्भ-निर्देशित संरेखण
- संदर्भ जीनोम और जीनोम बिल्ड (जैसे, GRCh38)
- जीनोम एनोटेशन
- प्रति-बेस गुणवत्ता (फ्रेड) स्कोर
Mechanisms
अनुक्रमण प्लेटफॉर्म भौतिक डीएनए को मशीन-पठनीय बेस कॉल में परिवर्तित करते हैं, प्रत्येक के साथ एक गुणवत्ता अनुमान होता है। क्योंकि अधिकांश प्लेटफॉर्म एक गुणसूत्र की तुलना में बहुत छोटे खंडों को ही पढ़ते हैं, इसलिए खंडों को संयोजित किया जाना चाहिए: डी नोवो संयोजन रीड ओवरलैप्स से जीनोम का पुनर्निर्माण करता है (ऐतिहासिक रूप से ओवरलैप-लेआउट-कंसेंसस, अब अक्सर शॉर्ट रीड्स के लिए डी ब्रुइन ग्राफ), जबकि संदर्भ-निर्देशित विश्लेषण रीड्स को मौजूदा संयोजन के साथ संरेखित करता है। एक संदर्भ जीनोम एक क्यूरेटेड सहमति अनुक्रम है, जिसे क्रमिक बिल्ड के रूप में संस्करणित किया जाता है और एनोटेशन के साथ स्तरित किया जाता है, जो क्षेत्र के लिए समन्वय प्रणाली प्रदान करता है। गुणवत्ता नियंत्रण और त्रुटि सुधार पूरी पाइपलाइन में होते हैं, प्रति-बेस सटीकता का अनुमान लगाते हैं और वेरिएंट को कॉल करने से पहले कलाकृतियों को हटाते या ठीक करते हैं।
Clinical relevance
विश्वसनीय अनुक्रमण, संयोजन और संदर्भ मानक नैदानिक और अनुसंधान जीनोमिक्स को रेखांकित करते हैं, क्योंकि वेरिएंट की व्याख्या एक अच्छी तरह से चित्रित संदर्भ के साथ संरेखित सटीक रीड्स पर निर्भर करती है। यह क्षेत्र उस बुनियादी ढांचे का वर्णन करता है जो जीनोमिक साक्ष्य उत्पन्न करता है; यह संदर्भ और शैक्षिक सामग्री है और व्यक्तिगत निदान या उपचार निर्णयों का आधार नहीं है।
Evidence & guidelines
यहां की विधियों को नैदानिक दिशानिर्देशों के बजाय ऐतिहासिक प्राथमिक अध्ययनों और कंसोर्टियम रिपोर्टों के माध्यम से प्रलेखित किया गया है: सेंगर की चेन-टर्मिनेशन विधि (1977), मानव जीनोम परियोजना का मसौदा (2001), अगली पीढ़ी के प्लेटफॉर्म की समीक्षा (मेट्ज़कर, 2010), और पूर्ण टेलोमेयर-टू-टेलोमेयर मानव जीनोम (नर्क एट अल।, 2022) इस क्षेत्र की यात्रा को दर्शाते हैं।
History
डीएनए अनुक्रमण 1977 में सेंगर की चेन-टर्मिनेशन रसायन विज्ञान से शुरू हुआ, जिसने पहले जीनोम को पढ़ने में सक्षम बनाया और 2001 में मानव जीनोम परियोजना के मसौदा अनुक्रम को शक्ति प्रदान की। उच्च-थ्रूपुट (अगली पीढ़ी) प्लेटफॉर्म के बाद के उदय ने लागत को कई गुना कम कर दिया, और लॉन्ग-रीड तकनीकों ने बाद में दोहराए जाने वाले क्षेत्रों को हल किया, जो 2022 में पहले पूर्ण, गैपलेस मानव जीनोम में परिणत हुआ।
Key figures
- Frederick Sanger
- Eric Lander
- Michael Metzker
- Sergey Koren
- Adam Phillippy
Related topics
Seminal works
- sanger-1977
- ihgsc-2001
- metzker-2009
- nurk-2022
Frequently asked questions
- अनुक्रमण और संयोजन में क्या अंतर है?
- अनुक्रमण डीएनए खंडों में न्यूक्लियोटाइड के क्रम को पढ़ता है, जबकि संयोजन वह कम्प्यूटेशनल चरण है जो उन खंडों को लंबी, सन्निहित अनुक्रमों जैसे कंटिग्स, स्कैफोल्ड्स या पूरे गुणसूत्रों में पुनर्निर्मित करता है।
- इस क्षेत्र को संदर्भ जीनोम की आवश्यकता क्यों है?
- एक संदर्भ जीनोम एक साझा, संस्करणित समन्वय प्रणाली प्रदान करता है ताकि विभिन्न व्यक्तियों और प्रयोगशालाओं से नए अनुक्रम डेटा को लगातार संरेखित, तुलना और व्याख्या किया जा सके।