عدم تعادل پیوستگی و برچسبگذاری SNP
عدم تعادل پیوستگی (LD) به همرخدادی غیرتصادفی آللها در موقعیتهای مختلف ژنوم اشاره دارد: واریانتهای نزدیک به هم تمایل دارند که به صورت بلوکهای هاپلوتایپ با هم به ارث برسند. این همبستگی همان چیزی است که مطالعات ارتباطی کل ژنوم را مقرونبهصرفه میکند – یک آرایه ژنوتیپبرداری تنها نیاز به تعیین زیرمجموعهای از SNPهای «برچسب» با دقت انتخابشده دارد، زیرا هر برچسب به صورت آماری نماینده واریانتهای ژنوتیپنشدهای است که با آنها در LD قوی قرار دارد.
Definition
عدم تعادل پیوستگی، ارتباط آماری بین آللها در دو یا چند جایگاه است – همرخدادی آنها بر روی هاپلوتایپها بیشتر یا کمتر از حد انتظار در صورت مستقل بودن آنها – و برچسبگذاری SNP استفاده از زیرمجموعهای از واریانتها است که از طریق LD، تنوع جایگاههای همسایه ژنوتیپنشده را ثبت میکنند.
Scope
این موضوع توضیح میدهد که LD چیست، چگونه اندازهگیری میشود (D' و r-squared)، چرا بلوکهایی را تشکیل میدهد که توسط نوترکیبی و تاریخچه جمعیت شکل گرفتهاند، چگونه SNPهای برچسب برای ثبت کارآمد تنوع رایج انتخاب میشوند، و چگونه LD هم امکان نقشهبرداری ارتباطی را فراهم میکند و هم مکانیابی واریانتهای علی را پیچیده میسازد. این یک مرجع روششناختی است، نه راهنمای بالینی.
Core questions
- عدم تعادل پیوستگی برای دو واریانت به چه معناست؟
- چگونه از D' و r-squared برای کمیسازی LD استفاده میشود و تفاوت آنها چیست؟
- چرا ژنوم به بلوکهای هاپلوتایپ تقسیم میشود و چه چیزی مرزهای آنها را تعیین میکند؟
- چگونه SNPهای برچسب انتخاب میشوند تا یک آرایه بیشتر تنوع رایج را ثبت کند؟
- چرا LD شناسایی واریانت علی واقعی را در یک منطقه مرتبط دشوار میکند؟
Key concepts
- هاپلوتایپ و بلوک هاپلوتایپ
- D' (ضریب عدم تعادل نرمالشده)
- r-squared (همبستگی بین نشانگرها)
- نقاط داغ نوترکیبی
- انتخاب SNP برچسب
- پانلهای هاپلوتایپ مرجع (HapMap، 1000 ژنوم)
- نقشهبرداری دقیق (Fine-mapping) و ابهام واریانت علی
Mechanisms
آللها در جایگاههای نزدیک به هم به ارث میرسند تا زمانی که نوترکیبی آنها را از هم جدا کند، بنابراین در طول نسلها LD با فاصله ژنتیکی کاهش مییابد و در نقاط داغ نوترکیبی از بین میرود و بلوکهایی با همبستگی داخلی بالا تولید میکند. دو معیار رایج آن را کمیسازی میکنند: D' نشان میدهد که آیا نوترکیبی بین دو جایگاه رخ داده است یا خیر، در حالی که r-squared اندازهگیری میکند که یک واریانت چقدر خوب واریانت دیگری را پیشبینی میکند و مستقیماً قدرت از دست رفته را هنگامی که یک SNP برچسب به عنوان نماینده یک واریانت علی ژنوتیپنشده عمل میکند، کنترل میکند. از آنجا که واریانتهای درون یک بلوک به شدت همبسته هستند، یک آرایه میتواند مجموعهای انتخاب شده از SNPهای برچسب را ژنوتیپبرداری کند و بیشتر تنوع رایج را بازیابی کند، و واریانتهای از دست رفته را میتوان به صورت آماری در برابر پانلهای مرجع توالیگذاری شده مانند HapMap و پروژه 1000 ژنوم تکمیل کرد. همان همبستگی که امکان برچسبگذاری را فراهم میکند، همچنین به این معنی است که سیگنال ارتباطی در بسیاری از واریانتها در یک بلوک مشترک است، بنابراین شناسایی واریانت علی واقعی نیاز به نقشهبرداری دقیقتر (fine-mapping) اضافی دارد تا صرفاً انتخاب مهمترین نشانگر.
Clinical relevance
ساختار LD زیربنای چگونگی تولید شواهد ژنتیکی در سراسر ژنوم و چگونگی تفسیر مناطق ارتباطی در تحقیقات بیماری است. این موضوع توصیفی از روش و ژنتیک جمعیت است؛ مبنایی برای آزمایش ژنتیکی فردی یا تفسیر بالینی نیست.
Evidence & guidelines
دانش ساختار LD انسانی بر منابع مرجع بزرگ استوار است تا دستورالعملهای بالینی. پروژه بینالمللی HapMap (2007) LD و SNPهای برچسب را در سراسر ژنوم نقشهبرداری کرد، پروژه 1000 ژنوم (2015) هاپلوتایپهای مرجع را در جمعیتهای متنوع گسترش داد، و بررسیهایی مانند Slatkin (2008) و Bush و Moore (2012) توضیح میدهند که چگونه معیارهای LD و برچسبگذاری در نقشهبرداری ارتباطی به کار میروند.
History
مفهوم ارتباط آللی پیش از ژنومیک وجود داشته است، اما اهمیت عملی آن با کشف در اوایل دهه 2000 افزایش یافت که ژنوم انسان دارای ساختار هاپلوتایپ بلوکمانند است که توسط نقاط داغ نوترکیبی شکل گرفته است. پروژه HapMap سپس LD را در سراسر ژنوم فهرستبندی کرد و انتخاب SNP برچسب را امکانپذیر ساخت، که مستقیماً اولین آرایههای GWAS مقرونبهصرفه را ممکن ساخت. پروژه 1000 ژنوم بعدها پانلهای مرجع را به بسیاری از جمعیتها گسترش داد، تکمیل دادهها را بهبود بخشید و نشان داد که الگوهای LD چگونه بر اساس تبار متفاوت هستند.
Debates
- آیا الگوهای LD بین جمعیتها منتقل میشوند؟
- ساختار هاپلوتایپ و LD با تاریخچه جمعیت متفاوت است، بنابراین SNPهای برچسب و پانلهای تکمیل داده که در یک تبار بهینه شدهاند، تنوع را در تبار دیگر به طور ناقص ثبت میکنند، که به کاهش عملکرد آرایهها و امتیازات مشتق شده از اروپاییها در سایر جمعیتها کمک میکند.
Key figures
- Montgomery Slatkin
- Mark Daly
- David Altshuler
- Goncalo Abecasis
- William Bush
Related topics
Seminal works
- slatkin-2008
- hapmap-2007
- 1000g-2015
Frequently asked questions
- چگونه عدم تعادل پیوستگی به GWAS اجازه میدهد تنها برخی از واریانتها را ژنوتیپبرداری کند؟
- از آنجا که واریانتها در یک بلوک هاپلوتایپ به شدت همبسته هستند، یک SNP برچسب ژنوتیپبرداری شده اطلاعاتی در مورد همسایگان ژنوتیپنشده خود حمل میکند، بنابراین مجموعهای از برچسبهای خوب انتخاب شده بیشتر تنوع رایج در ژنوم را ثبت میکند.
- تفاوت بین D' و r-squared چیست؟
- D' اندازهگیری میکند که آیا نوترکیبی به طور تاریخی دو آلل را از هم جدا کرده است یا خیر، در حالی که r-squared اندازهگیری میکند که یک واریانت چقدر خوب واریانت دیگری را به صورت آماری پیشبینی میکند؛ r-squared کمیتی است که بیشترین ارتباط را با قدرت آزمایش ارتباطی مبتنی بر SNP برچسب دارد.