تصميم دراسات الارتباط الجينومي الواسع (GWAS) وتنفيذها وأساليبها الإحصائية
يُعد تصميم وتحليل دراسة الارتباط الجينومي الواسع (GWAS) بمثابة مسار منهجي منضبط: تجميع الحالات والشواهد الموصوفة جيدًا (أو مجموعة سمات كمية)، وتحديد النمط الجيني للمتغيرات على مستوى الجينوم واستيفائها، وتنقية البيانات من خلال ضبط الجودة الصارم، واختبار كل متغير للارتباط مع تعديل الانحدار، والحكم على الإشارات مقابل عتبة الأهمية على مستوى الجينوم قبل السعي للتكرار. تهدف كل خطوة إلى منع العدد الهائل من الاختبارات الإحصائية من إنتاج اكتشافات خاطئة.
Definition
تصميم وتحليل دراسات الارتباط الجينومي الواسع (GWAS) هو مجموعة من خيارات تصميم الدراسة والإجراءات الإحصائية التي يتم من خلالها اختبار الارتباطات بين المتغيرات والأنماط الظاهرية على مستوى الجينوم، والتحكم في الإيجابيات الكاذبة عبر ملايين المقارنات، وتمييز الإشارات الموثوقة عن الأخطاء الناتجة عن تحديد النمط الجيني أو القرابة أو الانحدار.
Scope
يغطي هذا الموضوع العمود الفقري المنهجي لدراسة الارتباط الجينومي الواسع (GWAS): تعريف العينة والنمط الظاهري، وتحديد النمط الجيني والاستيفاء، وفلاتر ضبط الجودة، ونموذج الارتباط أحادي الواسم، وتصحيح الاختبارات المتعددة والأهمية على مستوى الجينوم، والتشخيصات مثل عامل التضخم الجينومي ومخططات QQ/Manhattan، والتكرار. إنه مرجع منهجي وليس بروتوكولًا للاختبار الجيني السريري.
Core questions
- ما هو حجم العينة وتعريف النمط الظاهري الذي يوفر قوة كافية للكشف عن المتغيرات ذات التأثيرات الصغيرة؟
- ما هي فلاتر ضبط الجودة التي تزيل المتغيرات والعينات غير الموثوقة قبل الاختبار؟
- ما هو نموذج الانحدار المستخدم لاختبار الارتباط أحادي الواسم، وكيف يتم تعديل الانحدار؟
- ما هي عتبة الأهمية التي تتحكم في الإيجابيات الكاذبة على مستوى الجينوم، ولماذا هي قريبة من 5 × 10^-8؟
- كيف يتم تمييز الإشارة الحقيقية عن التضخم الجينومي، ولماذا يتطلب الأمر التكرار؟
Key concepts
- تصميمات دراسة الحالات والشواهد والسمات الكمية
- تحديد النمط الجيني والاستيفاء
- ضبط الجودة (معدل الاستدعاء، MAF، فلاتر توازن هاردي-واينبرغ)
- اختبار الارتباط أحادي الواسم (الانحدار اللوجستي أو الخطي)
- النموذج الجيني الإضافي وتأثير كل أليل (نسبة الأرجحية أو بيتا)
- عتبة الأهمية على مستوى الجينوم (~5 × 10^-8)
- عامل التضخم الجينومي (لامدا) ومخططات QQ
- مخطط مانهاتن والتكرار
Mechanisms
يتم عادةً اختبار كل متغير باستخدام نموذج انحدار - لوجستي لحالة المرض الثنائية، وخطي للسمات الكمية - حيث يتم ترميز المتغير ضمن نموذج إضافي (لكل أليل) ويتم تضمين المكونات الرئيسية للانحدار بالإضافة إلى المتغيرات المساعدة الأخرى للتحكم في العوامل المربكة. وتكون النتيجة لكل متغير تقديرًا للتأثير (نسبة الأرجحية أو بيتا) وقيمة p. نظرًا لاختبار مئات الآلاف إلى ملايين المتغيرات الشائعة المستقلة إلى حد كبير، يتم الحكم على الأهمية مقابل عتبة على مستوى الجينوم تبلغ حوالي 5 × 10^-8، مشتقة من تصحيح بونفيروني للعدد الفعال للاختبارات المستقلة. قبل الاختبار، تزيل مراقبة الجودة العينات والمتغيرات ذات معدلات الاستدعاء المنخفضة، والانحراف الشديد عن توازن هاردي-واينبرغ في الشواهد، والتردد المنخفض جدًا للأليل الثانوي، أو دليل على القرابة والشواذ السكانية. يشير عامل التضخم الجينومي ومخططات QQ إلى العوامل المربكة المتبقية؛ وتعرض مخططات مانهاتن الإشارات عبر الجينوم؛ ويحمي التكرار المستقل من الأخطاء الخاصة بالتصميم. وقد قامت برامج مثل PLINK بتوحيد هذه الخطوات.
Clinical relevance
يُعد فهم تصميم وتحليل دراسات الارتباط الجينومي الواسع (GWAS) جزءًا من تقييم الأدلة الجينية المذكورة في أبحاث الأمراض وفي بناء الدرجات متعددة الجينات. يشرح هذا الموضوع كيفية توليد الارتباطات والتحقق منها وهو وصفي؛ إنه ليس إجراءً للتشخيص الجيني الفردي أو لاتخاذ القرارات السريرية.
Evidence & guidelines
تم توحيد الاتفاقيات التحليلية من خلال خبرة الكونسورتيوم والمراجعات المنهجية بدلاً من الإرشادات السريرية الرسمية. أظهر كونسورتيوم ويلكوم تراست لدراسة الحالات والشواهد (2007) تصميم التحكم المشترك وضبط الجودة الصارم على نطاق واسع؛ وأصبح PLINK (Purcell et al., 2007) مجموعة أدوات تحليلية قياسية؛ وتوضح المراجعات التي أجراها McCarthy et al. (2008) و Bush and Moore (2012) التوقعات المقبولة على نطاق واسع للقوة، وضبط الجودة، وعتبات الأهمية، والتكرار.
History
تَبَلْوَر المسار مع أولى المسوحات الجينومية الواسعة النطاق في منتصف العقد الأول من القرن الحادي والعشرين، عندما أصبحت المصفوفات الميسورة التكلفة والاستيفاء القائم على HapMap عمليًا لاختبار الجينوم بأكمله. وضعت دراسة كونسورتيوم ويلكوم تراست لدراسة الحالات والشواهد لعام 2007 سوابق مؤثرة للضوابط المشتركة، وضبط الجودة، وعتبة 5 × 10^-8، بينما أتاح إصدار PLINK للمجتمع مجموعة أدوات تحليلية مشتركة. وقد قامت المراجعات المنهجية لاحقًا بتقنين أفضل الممارسات، وتوسعت مجموعة الأدوات التحليلية لاحقًا لتشمل النماذج المختلطة، وأساليب الإحصاءات الموجزة، ومجموعات البيانات الحيوية الكبيرة جدًا.
Debates
- هل عتبة 5 × 10^-8 الثابتة مناسبة عبر تصميمات الدراسة والأصول العرقية؟
- تم معايرة العتبة الجينومية التقليدية للتغيرات الشائعة في عينات من أصول أوروبية؛ وتشير التسلسلات الأكثر كثافة، والمتغيرات الأكثر ندرة، والأصول العرقية الأخرى إلى عدد فعال مختلف من الاختبارات المستقلة، لذا فإن ما إذا كان ينبغي أن تكون العتبة خاصة بالتصميم هو أمر محل نقاش.
Key figures
- Shaun Purcell
- Mark McCarthy
- Jason Moore
- William Bush
- Peter Visscher
Related topics
Seminal works
- wtccc-2007
- purcell-2007
- mccarthy-2008
Frequently asked questions
- لماذا تم تحديد عتبة الأهمية في دراسات الارتباط الجينومي الواسع (GWAS) بالقرب من 5 × 10^-8؟
- إنها تقريب لتصحيح بونفيروني لما يقرب من مليون متغير شائع مستقل فعليًا في الجينوم البشري، مما يحافظ على معدل الإيجابيات الكاذبة على مستوى الجينوم بالقرب من المستوى التقليدي 0.05.
- لماذا يجب تكرار نتائج دراسات الارتباط الجينومي الواسع (GWAS)؟
- يمكن أن تنتج دراسة واحدة ارتباطات زائفة من مشاكل ضبط الجودة الدقيقة، أو العوامل المربكة المتبقية، أو الصدفة عند حافة الأهمية؛ والتكرار المستقل في عينة منفصلة هو التحقق القياسي من أن الإشارة حقيقية.