طبقهبندی جمعیت و تبار در GWAS
طبقهبندی جمعیت به تفاوت سیستماتیک در تبار میان افرادی که در یک مطالعه ژنتیکی مقایسه میشوند، اشاره دارد. هنگامی که موارد و کنترلها از نظر پیشینه تباری متفاوت باشند، هر واریانتی که فراوانی آن بین این تبارها متفاوت باشد، حتی اگر نقش سببی نداشته باشد، با صفت مرتبط به نظر میرسد – این یک عامل مخدوشکننده است که میتواند نتایج مثبت کاذب را در سراسر ژنوم ایجاد کند. بنابراین، تشخیص و تنظیم تبار یک محافظ اصلی برای آزمونهای معتبر ارتباطی است.
Definition
طبقهبندی جمعیت، مخدوش شدن ارتباط ژنوتیپ-فنوتیپ توسط تفاوتهای سیستماتیک تباری بین گروههای مقایسهشده است، و کنترل آن مجموعهای از روشها – عمدتاً مؤلفههای اصلی تبار و مدلهای ترکیبی – است که آزمونهای ارتباطی را تنظیم میکنند تا سیگنالها به جای خود تبار، منعکسکننده اثرات درون تباری باشند.
Scope
این موضوع به این میپردازد که چرا تفاوتهای تباری آزمونهای ارتباطی را مخدوش میکنند، چگونه طبقهبندی تشخیص داده میشود (تورم ژنومی، تحلیل مؤلفههای اصلی)، چگونه تصحیح میشود (کوواریتهای مؤلفه اصلی، مدلهای ترکیبی، کنترل ژنومی)، و نگرانی گستردهتر برابری که سوگیری تبار اروپایی در GWAS، قابلیت انتقال یافتهها و نمرات پلیژنیک را محدود میکند. این یک مرجع روششناختی است، نه راهنمای بالینی.
Core questions
- چگونه تفاوتهای تباری بین موارد و کنترلها ارتباطات کاذب ایجاد میکنند؟
- طبقهبندی چگونه تشخیص داده میشود و عامل تورم کنترل ژنومی چه چیزی را نشان میدهد؟
- تحلیل مؤلفههای اصلی چگونه تبار را تصحیح میکند؟
- چه زمانی مدلهای ترکیبی برای مدیریت ساختار و خویشاوندی ترجیح داده میشوند؟
- چرا سوگیری تبار اروپایی در GWAS، قابلیت کلیسازی را محدود میکند؟
Key concepts
- مخدوشکنندگی توسط تبار
- کنترل ژنومی و عامل تورم (لامبدا)
- تحلیل مؤلفههای اصلی ژنوتیپها
- نشانگرهای اطلاعاتی تبار
- مدلهای خطی ترکیبی برای ساختار و خویشاوندی
- آمیختگی و تبار پیوسته
- قابلیت انتقال یافتهها و نمرات پلیژنیک در میان تبارها
Mechanisms
اگر زیرگروههایی با تبار متفاوت به طور نابرابر در میان موارد و کنترلها نمایش داده شوند، و اگر هم خطر بیماری و هم فراوانی آلل بین این زیرگروهها متفاوت باشد، فراوانی آلل از طریق تبار و نه علیت، صفت را دنبال خواهد کرد و آمارههای آزمون را در سراسر ژنوم افزایش میدهد. تشخیص بر این امضای سراسر ژنومی متکی است: عامل تورم کنترل ژنومی نشان میدهد که میانگین آماره آزمون چقدر از انتظار تهی خود فراتر میرود، و تحلیل مؤلفههای اصلی ژنوتیپهای سراسر ژنومی، محورهای تغییر تبار را در میان نمونهها آشکار میکند. تصحیح معمولاً شامل مؤلفههای اصلی پیشرو به عنوان کوواریت در رگرسیون است که سیگنال تبار را جذب میکند، یا از مدلهای خطی ترکیبی استفاده میکند که به طور مشترک ساختار و خویشاوندی پنهان را از طریق یک ماتریس رابطه ژنتیکی در نظر میگیرد. پانلهای مرجع مانند پروژه 1000 ژنوم به قرار دادن نمونهها بر روی یک نقشه تبار جهانی و اطلاعرسانی در مورد ایمپوتاسیون کمک میکنند. از آنجا که بیشتر نمونههای GWAS از تبار اروپایی هستند، حتی تحلیلهای به خوبی تصحیحشده نیز برآوردهای اثر و نمرات پلیژنیک را به دست میدهند که به طور ناقص به جمعیتهای دیگر منتقل میشوند.
Clinical relevance
تنظیم تبار برای اعتبار شواهد ژنتیکی مورد استفاده در تحقیقات بیماری ضروری است، و ترکیب تباری مطالعات مستقیماً بر این تأثیر میگذارد که زیستشناسی چه کسانی در یافتهها و نمرات ژنومی نمایش داده میشود. این موضوع توصیفی از روشها و ملاحظات برابری است؛ مبنایی برای آزمایش ژنتیکی فردی یا تفسیر بالینی نیست.
Evidence & guidelines
استانداردها در اینجا از ادبیات روششناختی نشأت میگیرند تا دستورالعملهای بالینی. پرایس و همکاران (2006) تصحیح مؤلفههای اصلی (رویکرد EIGENSTRAT) را به عنوان یک راهحل مقیاسپذیر معرفی کردند؛ پرایس و همکاران (2010) استراتژیها از جمله مدلهای ترکیبی را بررسی و گسترش دادند؛ پروژه 1000 ژنوم (2015) مرجع متنوع مورد نیاز برای توصیف تبار را فراهم کرد؛ و ویشر و همکاران (2017) به پیامدهای کلیسازی و برابری عدم تعادل تبار اشاره میکنند.
History
نگرانی از اینکه تبار میتواند ارتباط ژنتیکی را مخدوش کند، پیش از GWAS وجود داشت، و رویکردهای اولیه مانند کنترل ژنومی و ارتباط ساختاریافته برای رفع آن توسعه یافتند. معرفی تحلیل مؤلفههای اصلی در سال 2006، راهی سریع و سراسر ژنومی برای مدلسازی تبار پیوسته فراهم کرد و به یک رویه استاندارد تبدیل شد، که بعدها با روشهای مدل ترکیبی که خویشاوندی را نیز مدیریت میکنند، تکمیل شد. با گسترش GWAS به بیوبانکها، این حوزه به طور فزایندهای تشخیص داد که کنترل طبقهبندی در نمونههای عمدتاً اروپایی، مشکل بزرگتر کمنمایی سایر تبارها را حل نمیکند.
Debates
- آیا تصحیحات تبار به طور کامل مخدوشکنندگی را از بین میبرند، یا میتوانند سیگنال واقعی را نیز حذف کنند؟
- مؤلفههای اصلی و مدلهای ترکیبی طبقهبندی را در بیشتر تنظیمات به طور مؤثر کنترل میکنند، اما تمایز بین مخدوشکنندگی و زیستشناسی واقعی مرتبط با تبار – و اجتناب از تصحیح بیش از حد که اثرات واقعی را از بین میبرد – به ویژه برای صفاتی با ساختار جغرافیایی ظریف، یک قضاوت روششناختی باقی میماند.
- آیا سوگیری تبار اروپایی در GWAS، برابری و اعتبار را تضعیف میکند؟
- یافتهها و نمرات پلیژنیک که عمدتاً از نمونههای تبار اروپایی به دست آمدهاند، به طور ناقص به جمعیتهای دیگر منتقل میشوند و نگرانیهای علمی در مورد قابلیت کلیسازی و نگرانیهای برابری در مورد توزیع مزایای پزشکی ژنومی را افزایش میدهند.
Key figures
- Alkes Price
- David Reich
- Nick Patterson
- Noah Zaitlen
- Peter Visscher
Related topics
Seminal works
- price-2006
- price-2010
Frequently asked questions
- طبقهبندی جمعیت چگونه نتایج کاذب GWAS را ایجاد میکند؟
- اگر موارد و کنترلها از نظر تبار متفاوت باشند، واریانتهایی که فراوانی آنها بین این تبارها متفاوت است، به دلیل تبار و نه علیت، با صفت مرتبط به نظر میرسند و ارتباطات کاذب را در سراسر ژنوم ایجاد میکنند.
- طبقهبندی معمولاً چگونه تصحیح میشود؟
- رویکرد استاندارد شامل مؤلفههای اصلی پیشرو ژنوتیپهای سراسر ژنومی به عنوان کوواریت است، یا از یک مدل خطی ترکیبی استفاده میکند، به طوری که آزمونهای ارتباطی منعکسکننده اثرات درون تبار باشند تا تفاوتهای تباری.