GWAS डिज़ाइन, निष्पादन और सांख्यिकीय विधियाँ
एक जीनोम-व्यापी एसोसिएशन अध्ययन (GWAS) को डिज़ाइन करना और उसका विश्लेषण करना एक अनुशासित प्रक्रिया है: अच्छी तरह से फेनोटाइप किए गए मामलों और नियंत्रणों (या एक मात्रात्मक-विशेषता समूह) को इकट्ठा करना, जीनोम-व्यापी वेरिएंट का जीनोटाइप करना और उनका अनुमान लगाना, कठोर गुणवत्ता नियंत्रण के माध्यम से डेटा को साफ करना, प्रत्येक वेरिएंट का वंश के लिए समायोजन करते हुए एसोसिएशन के लिए परीक्षण करना, और प्रतिकृति की तलाश करने से पहले जीनोम-व्यापी महत्व सीमा के खिलाफ संकेतों का मूल्यांकन करना। प्रत्येक चरण का उद्देश्य सांख्यिकीय परीक्षणों की भारी संख्या को गलत खोजों से रोकना है।
Definition
GWAS डिज़ाइन और विश्लेषण अध्ययन-डिज़ाइन विकल्पों और सांख्यिकीय प्रक्रियाओं का एक समूह है जिसके द्वारा वेरिएंट-फेनोटाइप एसोसिएशनों का जीनोम-व्यापी परीक्षण किया जाता है, लाखों तुलनाओं में गलत सकारात्मकता को नियंत्रित किया जाता है, और विश्वसनीय संकेतों को जीनोटाइपिंग, संबंधितता या वंश के कलाकृतियों से अलग किया जाता है।
Scope
यह विषय GWAS की कार्यप्रणाली संबंधी रीढ़ को शामिल करता है: नमूना और फेनोटाइप परिभाषा, जीनोटाइपिंग और अनुमान, गुणवत्ता-नियंत्रण फिल्टर, एकल-मार्कर एसोसिएशन मॉडल, बहु-परीक्षण सुधार और जीनोम-व्यापी महत्व, जीनोमिक इन्फ्लेशन फैक्टर और QQ/मैनहट्टन प्लॉट जैसे निदान, और प्रतिकृति। यह एक विधि संदर्भ है न कि नैदानिक आनुवंशिक परीक्षण के लिए एक प्रोटोकॉल।
Core questions
- छोटे-प्रभाव वाले वेरिएंट का पता लगाने के लिए कौन सा नमूना आकार और फेनोटाइप परिभाषा पर्याप्त शक्ति प्रदान करती है?
- परीक्षण से पहले कौन से गुणवत्ता-नियंत्रण फिल्टर अविश्वसनीय वेरिएंट और नमूनों को हटाते हैं?
- एकल-मार्कर एसोसिएशन परीक्षण के लिए किस प्रतिगमन मॉडल का उपयोग किया जाता है, और वंश को कैसे समायोजित किया जाता है?
- कौन सी महत्व सीमा जीनोम-व्यापी गलत सकारात्मकता को नियंत्रित करती है, और यह 5 x 10^-8 के करीब क्यों है?
- जीनोमिक इन्फ्लेशन से एक वास्तविक संकेत को कैसे अलग किया जाता है, और प्रतिकृति की आवश्यकता क्यों है?
Key concepts
- केस-कंट्रोल और मात्रात्मक-विशेषता डिज़ाइन
- जीनोटाइप कॉलिंग और अनुमान
- गुणवत्ता नियंत्रण (कॉल दर, MAF, हार्डी-वीनबर्ग संतुलन फिल्टर)
- एकल-मार्कर एसोसिएशन परीक्षण (लॉजिस्टिक या रैखिक प्रतिगमन)
- योगात्मक आनुवंशिक मॉडल और प्रति-एलील प्रभाव (विषम अनुपात या बीटा)
- जीनोम-व्यापी महत्व सीमा (~5 x 10^-8)
- जीनोमिक इन्फ्लेशन फैक्टर (लैम्ब्डा) और QQ प्लॉट
- मैनहट्टन प्लॉट और प्रतिकृति
Mechanisms
प्रत्येक वेरिएंट का आमतौर पर एक प्रतिगमन मॉडल के साथ परीक्षण किया जाता है - बाइनरी रोग स्थिति के लिए लॉजिस्टिक, मात्रात्मक लक्षणों के लिए रैखिक - जिसमें वेरिएंट को एक योगात्मक (प्रति-एलील) मॉडल के तहत कोडित किया जाता है और वंश के प्रमुख घटकों के साथ-साथ अन्य सहसंयोजकों को भ्रम को नियंत्रित करने के लिए शामिल किया जाता है। प्रति वेरिएंट परिणाम एक प्रभाव अनुमान (विषम अनुपात या बीटा) और एक पी-मान होता है। क्योंकि लाखों की संख्या में बड़े पैमाने पर स्वतंत्र सामान्य वेरिएंट का परीक्षण किया जाता है, महत्व का मूल्यांकन लगभग 5 x 10^-8 की जीनोम-व्यापी सीमा के खिलाफ किया जाता है, जो स्वतंत्र परीक्षणों की प्रभावी संख्या के लिए बोनफेरोनी-शैली सुधार से प्राप्त होता है। परीक्षण से पहले, गुणवत्ता नियंत्रण कम कॉल दरों, नियंत्रणों में हार्डी-वीनबर्ग संतुलन से अत्यधिक विचलन, बहुत कम माइनर-एलील आवृत्ति, या संबंधितता और जनसंख्या आउटलायर्स के सबूत वाले नमूनों और वेरिएंट को हटा देता है। जीनोमिक इन्फ्लेशन फैक्टर और QQ प्लॉट अवशिष्ट भ्रम को चिह्नित करते हैं; मैनहट्टन प्लॉट पूरे जीनोम में संकेतों को प्रदर्शित करते हैं; और स्वतंत्र प्रतिकृति डिज़ाइन-विशिष्ट कलाकृतियों से बचाव करती है। PLINK जैसे सॉफ्टवेयर ने इन चरणों को मानकीकृत किया।
Clinical relevance
GWAS डिज़ाइन और विश्लेषण को समझना रोग अनुसंधान में उद्धृत आनुवंशिक साक्ष्य और पॉलीजेनिक स्कोर के निर्माण का मूल्यांकन करने का एक हिस्सा है। यह विषय बताता है कि एसोसिएशन कैसे उत्पन्न और मान्य होते हैं और वर्णनात्मक है; यह व्यक्तिगत आनुवंशिक निदान या नैदानिक निर्णय लेने की प्रक्रिया नहीं है।
Evidence & guidelines
विश्लेषणात्मक परंपराओं को औपचारिक नैदानिक दिशानिर्देशों के बजाय कंसोर्टियम अनुभव और कार्यप्रणाली संबंधी समीक्षाओं के माध्यम से समेकित किया गया था। वेलकॉम ट्रस्ट केस कंट्रोल कंसोर्टियम (2007) ने साझा-नियंत्रण डिज़ाइन और बड़े पैमाने पर कठोर गुणवत्ता नियंत्रण का प्रदर्शन किया; PLINK (पर्सेल एट अल., 2007) एक मानक विश्लेषण टूलकिट बन गया; और मैकार्थी एट अल. (2008) और बुश और मूर (2012) द्वारा की गई समीक्षाओं ने शक्ति, गुणवत्ता नियंत्रण, महत्व सीमा और प्रतिकृति के लिए व्यापक रूप से स्वीकृत अपेक्षाओं को निर्धारित किया।
History
यह प्रक्रिया 2000 के दशक के मध्य में पहले बड़े जीनोम-व्यापी स्कैन के साथ क्रिस्टलीकृत हुई, जब किफायती एरे और हैपमैप-आधारित अनुमान ने पूरे-जीनोम परीक्षण को व्यावहारिक बना दिया। 2007 के वेलकॉम ट्रस्ट केस कंट्रोल कंसोर्टियम अध्ययन ने साझा नियंत्रणों, गुणवत्ता नियंत्रण और 5 x 10^-8 सीमा के लिए प्रभावशाली मिसालें कायम कीं, जबकि PLINK की रिलीज़ ने समुदाय को एक सामान्य विश्लेषणात्मक टूलसेट दिया। कार्यप्रणाली संबंधी समीक्षाओं ने बाद में सर्वोत्तम अभ्यास को संहिताबद्ध किया, और विश्लेषणात्मक टूलकिट बाद में मिश्रित मॉडल, सारांश-सांख्यिकी विधियों और बहुत बड़े बायोबैंक समूहों तक विस्तारित हुआ।
Debates
- क्या अध्ययन डिज़ाइन और वंशों में एक निश्चित 5 x 10^-8 सीमा उपयुक्त है?
- पारंपरिक जीनोम-व्यापी सीमा को यूरोपीय-वंश के नमूनों में सामान्य भिन्नता के लिए कैलिब्रेट किया गया था; सघन अनुक्रमण, दुर्लभ वेरिएंट और अन्य वंशों का अर्थ स्वतंत्र परीक्षणों की एक अलग प्रभावी संख्या है, इसलिए यह बहस का विषय है कि क्या सीमा डिज़ाइन-विशिष्ट होनी चाहिए।
Key figures
- Shaun Purcell
- Mark McCarthy
- Jason Moore
- William Bush
- Peter Visscher
Related topics
Seminal works
- wtccc-2007
- purcell-2007
- mccarthy-2008
Frequently asked questions
- GWAS महत्व सीमा 5 x 10^-8 के करीब क्यों निर्धारित की गई है?
- यह मानव जीनोम में लगभग दस लाख प्रभावी रूप से स्वतंत्र सामान्य वेरिएंट के लिए बोनफेरोनी सुधार का अनुमान लगाता है, जिससे जीनोम-व्यापी गलत-सकारात्मक दर पारंपरिक 0.05 स्तर के करीब रहती है।
- GWAS खोज को दोहराना क्यों आवश्यक है?
- एकल अध्ययन सूक्ष्म गुणवत्ता-नियंत्रण समस्याओं, अवशिष्ट भ्रम, या महत्व के किनारे पर संयोग से गलत एसोसिएशन उत्पन्न कर सकता है; एक अलग नमूने में स्वतंत्र प्रतिकृति यह जांचने का मानक तरीका है कि एक संकेत वास्तविक है।