कॉपी संख्या वेरिएंट: पहचान और वर्गीकरण
कॉपी-संख्या वेरिएंट (CNV) डीएनए का एक खंड है जो व्यक्तियों के बीच प्रतियों की एक अलग संख्या में मौजूद होता है—संदर्भ जीनोम के सापेक्ष दोहराव के माध्यम से प्राप्त या विलोपन के माध्यम से खोया हुआ। CNV संरचनात्मक भिन्नता का एक प्रमुख घटक हैं, और केंद्रीय कार्यप्रणाली संबंधी प्रश्न यह हैं कि उन्हें सरणी या अनुक्रमण डेटा से विश्वसनीय रूप से कैसे पता लगाया जाए और उन्हें आकार, कॉपी स्थिति और संभावित महत्व के अनुसार कैसे वर्गीकृत किया जाए।
Definition
कॉपी-संख्या वेरिएंट डीएनए का एक खंड है, पारंपरिक रूप से एक किलोबेस या उससे बड़ा, जो एक संदर्भ जीनोम की तुलना में मौजूद प्रतियों की संख्या में भिन्न होता है, जो एक विलोपन (कॉपी हानि) या एक दोहराव या उच्च-क्रम प्रवर्धन (कॉपी लाभ) के रूप में उत्पन्न होता है।
Scope
यह विषय बताता है कि CNV क्या है, उन्हें पता लगाने और उनका आकार निर्धारित करने के लिए उपयोग की जाने वाली प्रमुख प्रौद्योगिकियां (सरणी तुलनात्मक जीनोमिक संकरण, SNP सरणियाँ, और अनुक्रमण से रीड-डेप्थ या युग्मित-अंत संकेत), और वे आधार जिन पर उन्हें वर्गीकृत किया जाता है—लाभ बनाम हानि, कॉपी संख्या, पुनरावृत्ति, और आवृत्ति। यह पहचान और वर्गीकरण अवधारणाओं का एक संदर्भ उपचार है और व्यक्तियों के लिए नैदानिक व्याख्या प्रदान नहीं करता है।
Core questions
- कॉपी-संख्या वेरिएंट को अन्य संरचनात्मक वेरिएंट से क्या अलग करता है?
- कौन से संकेत—संकरण तीव्रता, रीड डेप्थ, युग्मित-अंत और स्प्लिट-रीड साक्ष्य—CNV को कॉल करने के लिए उपयोग किए जाते हैं?
- CNV को कॉपी स्थिति, आकार, पुनरावृत्ति और जनसंख्या आवृत्ति के अनुसार कैसे वर्गीकृत किया जाता है?
- प्रत्येक पहचान प्लेटफॉर्म की रिज़ॉल्यूशन सीमाएँ और गलत-कॉल स्रोत क्या हैं?
Key concepts
- कॉपी लाभ (दोहराव) और कॉपी हानि (विलोपन)
- सरणी तुलनात्मक जीनोमिक संकरण (aCGH)
- SNP सरणी लॉग R अनुपात और B-एलील आवृत्ति
- रीड-डेप्थ और युग्मित-अंत पहचान
- ब्रेकपॉइंट रिज़ॉल्यूशन
- पुनरावर्ती बनाम गैर-पुनरावर्ती CNV
- जनसंख्या आवृत्ति और सौम्य बनाम रोगजनक वर्गीकरण
Mechanisms
CNV का पता लगाना डीएनए खुराक में एक भौतिक परिवर्तन को एक मापने योग्य संकेत में बदल देता है। सरणी तुलनात्मक जीनोमिक संकरण और SNP सरणियाँ सापेक्ष संकरण तीव्रता को पढ़ती हैं, इसलिए एक विलोपन प्रभावित अंतराल में संकेत को कम करता है और एक दोहराव बढ़ाता है; SNP सरणियाँ एलील-अनुपात जानकारी जोड़ती हैं जो कॉपी स्थितियों को अलग करने में मदद करती हैं। अनुक्रमण-आधारित दृष्टिकोण रीड डेप्थ से कॉपी संख्या का अनुमान लगाते हैं—दोहराए गए क्षेत्रों पर अधिक रीड जमा होते हैं और विलोपन पर कम—और ब्रेकपॉइंट्स को स्थानीयकृत करने के लिए असंगत युग्मित-अंत और स्प्लिट-रीड संरेखण का उपयोग करते हैं। वर्गीकरण तब कॉपी स्थिति, आकार, क्या वेरिएंट वास्तुकला-परिभाषित ब्रेकपॉइंट्स पर दोहराया जाता है, और संदर्भ आबादी में इसकी आवृत्ति को जोड़ता है।
Clinical relevance
कॉपी-संख्या विश्लेषण का व्यापक रूप से स्वास्थ्य विज्ञान में जीनोमिक लाभ और हानि को चिह्नित करने के लिए उपयोग किया जाता है, और दुर्लभ खुराक-परिवर्तन घटनाओं से सामान्य सौम्य CNV को अलग करना जीनोमिक डेटा की व्याख्या के लिए केंद्रीय है। यह प्रविष्टि बताती है कि CNV को एक कार्यप्रणाली संबंधी मामले के रूप में कैसे पता लगाया और वर्गीकृत किया जाता है; यह व्यक्तिगत निदान या प्रबंधन का आधार नहीं है।
Epidemiology
प्रारंभिक जीनोम-व्यापी सर्वेक्षणों ने स्थापित किया कि CNV स्वस्थ व्यक्तियों में आम हैं: सेबाट और सहयोगियों ने पहली बार व्यापक कॉपी-संख्या बहुरूपता दिखाई, और रेडॉन और सहयोगियों ने हैपमैप आबादी में वैश्विक CNV का मानचित्रण किया। बाद के अनुक्रमण-आधारित कैटलॉग, जिसमें 1000 जीनोम संरचनात्मक-भिन्नता मानचित्र शामिल है, ने आवृत्तियों को परिष्कृत किया और दिखाया कि विलोपन और दोहराव सामूहिक रूप से परिवर्तनीय जीनोम के एक बड़े हिस्से को फैलाते हैं।
History
यह पहचान कि स्वस्थ लोगों के बीच कॉपी संख्या व्यापक रूप से भिन्न होती है, 2004 में सेबाट और इयाफ्रेते और सहयोगियों द्वारा किए गए सरणी अध्ययनों से उभरी, जिसने इस धारणा को पलट दिया कि ऐसी भिन्नता दुर्लभ थी। सरणी प्लेटफार्मों से पूरे-जीनोम CNV मानचित्र 2006 में आए, और अगले दशक में उच्च-थ्रूपुट अनुक्रमण में बदलाव से रीड-डेप्थ और युग्मित-अंत विधियाँ आईं जिन्होंने ब्रेकपॉइंट रिज़ॉल्यूशन में सुधार किया और CNV कॉलिंग को सामान्य संरचनात्मक-भिन्नता खोज में विलय कर दिया।
Debates
- पहचान-प्लेटफॉर्म के अंतरों को कैसे सुलझाया जाना चाहिए?
- सरणियाँ और अनुक्रमण-आधारित कॉलर अतिव्यापी लेकिन गैर-समान CNV सेटों की रिपोर्ट करते हैं, जो आकार रिज़ॉल्यूशन, ब्रेकपॉइंट सटीकता और दोहराए जाने वाले क्षेत्रों में संवेदनशीलता में भिन्न होते हैं, इसलिए प्लेटफार्मों में कॉल और आवृत्तियों का सामंजस्य एक मान्यता प्राप्त कार्यप्रणाली संबंधी चुनौती बना हुआ है।
Key figures
- Jonathan Sebat
- Stephen W. Scherer
- Charles Lee
- Evan E. Eichler
- Nigel P. Carter
Related topics
Seminal works
- sebat-2004
- redon-2006
- alkan-2011
Frequently asked questions
- CNV और विलोपन में क्या अंतर है?
- विलोपन एक प्रकार का कॉपी-संख्या वेरिएंट है (एक कॉपी हानि)। CNV शब्द व्यापक है और इसमें दोहराव और उच्च-क्रम कॉपी लाभ भी शामिल हैं, इसलिए प्रासंगिक आकार का प्रत्येक विलोपन एक CNV है लेकिन प्रत्येक CNV विलोपन नहीं है।
- एक ही नमूने के लिए दो प्लेटफॉर्म अलग-अलग CNV की रिपोर्ट क्यों कर सकते हैं?
- सरणी और अनुक्रमण विधियाँ दोहराए जाने वाले क्षेत्रों के भीतर रिज़ॉल्यूशन, ब्रेकपॉइंट सटीकता और संवेदनशीलता में भिन्न होती हैं, इसलिए वे वेरिएंट के अतिव्यापी लेकिन समान सेटों को कैप्चर नहीं करती हैं और एक ही घटना का आकार अलग-अलग हो सकता है।
Methods for this concept
- Copy Number Variation Analysis
- Machine learning-assisted copy number variation analysis
- Bayesian Copy Number Variation Analysis
- Differential Copy Number Variation Analysis
- Single-cell Copy Number Variation Analysis
- Variant Calling
- Time-series copy number variation analysis
- Network-based copy number variation analysis