ScholarGate
دستیار

عدم تعادل پیوستگی و برچسب‌گذاری SNP

عدم تعادل پیوستگی (LD) به هم‌رخدادی غیرتصادفی آلل‌ها در موقعیت‌های مختلف ژنوم اشاره دارد: واریانت‌های نزدیک به هم تمایل دارند که به صورت بلوک‌های هاپلوتایپ با هم به ارث برسند. این همبستگی همان چیزی است که مطالعات ارتباطی کل ژنوم را مقرون‌به‌صرفه می‌کند – یک آرایه ژنوتیپ‌برداری تنها نیاز به تعیین زیرمجموعه‌ای از SNPهای «برچسب» با دقت انتخاب‌شده دارد، زیرا هر برچسب به صورت آماری نماینده واریانت‌های ژنوتیپ‌نشده‌ای است که با آن‌ها در LD قوی قرار دارد.

یافتن موضوع با PaperMindبه‌زودیFind papers & topics
Tools & resources
دریافت اسلایدها
Learn & explore
ویدیوبه‌زودی

Definition

عدم تعادل پیوستگی، ارتباط آماری بین آلل‌ها در دو یا چند جایگاه است – هم‌رخدادی آن‌ها بر روی هاپلوتایپ‌ها بیشتر یا کمتر از حد انتظار در صورت مستقل بودن آن‌ها – و برچسب‌گذاری SNP استفاده از زیرمجموعه‌ای از واریانت‌ها است که از طریق LD، تنوع جایگاه‌های همسایه ژنوتیپ‌نشده را ثبت می‌کنند.

Scope

این موضوع توضیح می‌دهد که LD چیست، چگونه اندازه‌گیری می‌شود (D' و r-squared)، چرا بلوک‌هایی را تشکیل می‌دهد که توسط نوترکیبی و تاریخچه جمعیت شکل گرفته‌اند، چگونه SNPهای برچسب برای ثبت کارآمد تنوع رایج انتخاب می‌شوند، و چگونه LD هم امکان نقشه‌برداری ارتباطی را فراهم می‌کند و هم مکان‌یابی واریانت‌های علی را پیچیده می‌سازد. این یک مرجع روش‌شناختی است، نه راهنمای بالینی.

Core questions

  • عدم تعادل پیوستگی برای دو واریانت به چه معناست؟
  • چگونه از D' و r-squared برای کمی‌سازی LD استفاده می‌شود و تفاوت آن‌ها چیست؟
  • چرا ژنوم به بلوک‌های هاپلوتایپ تقسیم می‌شود و چه چیزی مرزهای آن‌ها را تعیین می‌کند؟
  • چگونه SNPهای برچسب انتخاب می‌شوند تا یک آرایه بیشتر تنوع رایج را ثبت کند؟
  • چرا LD شناسایی واریانت علی واقعی را در یک منطقه مرتبط دشوار می‌کند؟

Key concepts

  • هاپلوتایپ و بلوک هاپلوتایپ
  • D' (ضریب عدم تعادل نرمال‌شده)
  • r-squared (همبستگی بین نشانگرها)
  • نقاط داغ نوترکیبی
  • انتخاب SNP برچسب
  • پانل‌های هاپلوتایپ مرجع (HapMap، 1000 ژنوم)
  • نقشه‌برداری دقیق (Fine-mapping) و ابهام واریانت علی

Mechanisms

آلل‌ها در جایگاه‌های نزدیک به هم به ارث می‌رسند تا زمانی که نوترکیبی آن‌ها را از هم جدا کند، بنابراین در طول نسل‌ها LD با فاصله ژنتیکی کاهش می‌یابد و در نقاط داغ نوترکیبی از بین می‌رود و بلوک‌هایی با همبستگی داخلی بالا تولید می‌کند. دو معیار رایج آن را کمی‌سازی می‌کنند: D' نشان می‌دهد که آیا نوترکیبی بین دو جایگاه رخ داده است یا خیر، در حالی که r-squared اندازه‌گیری می‌کند که یک واریانت چقدر خوب واریانت دیگری را پیش‌بینی می‌کند و مستقیماً قدرت از دست رفته را هنگامی که یک SNP برچسب به عنوان نماینده یک واریانت علی ژنوتیپ‌نشده عمل می‌کند، کنترل می‌کند. از آنجا که واریانت‌های درون یک بلوک به شدت همبسته هستند، یک آرایه می‌تواند مجموعه‌ای انتخاب شده از SNPهای برچسب را ژنوتیپ‌برداری کند و بیشتر تنوع رایج را بازیابی کند، و واریانت‌های از دست رفته را می‌توان به صورت آماری در برابر پانل‌های مرجع توالی‌گذاری شده مانند HapMap و پروژه 1000 ژنوم تکمیل کرد. همان همبستگی که امکان برچسب‌گذاری را فراهم می‌کند، همچنین به این معنی است که سیگنال ارتباطی در بسیاری از واریانت‌ها در یک بلوک مشترک است، بنابراین شناسایی واریانت علی واقعی نیاز به نقشه‌برداری دقیق‌تر (fine-mapping) اضافی دارد تا صرفاً انتخاب مهم‌ترین نشانگر.

Clinical relevance

ساختار LD زیربنای چگونگی تولید شواهد ژنتیکی در سراسر ژنوم و چگونگی تفسیر مناطق ارتباطی در تحقیقات بیماری است. این موضوع توصیفی از روش و ژنتیک جمعیت است؛ مبنایی برای آزمایش ژنتیکی فردی یا تفسیر بالینی نیست.

Evidence & guidelines

دانش ساختار LD انسانی بر منابع مرجع بزرگ استوار است تا دستورالعمل‌های بالینی. پروژه بین‌المللی HapMap (2007) LD و SNPهای برچسب را در سراسر ژنوم نقشه‌برداری کرد، پروژه 1000 ژنوم (2015) هاپلوتایپ‌های مرجع را در جمعیت‌های متنوع گسترش داد، و بررسی‌هایی مانند Slatkin (2008) و Bush و Moore (2012) توضیح می‌دهند که چگونه معیارهای LD و برچسب‌گذاری در نقشه‌برداری ارتباطی به کار می‌روند.

History

مفهوم ارتباط آللی پیش از ژنومیک وجود داشته است، اما اهمیت عملی آن با کشف در اوایل دهه 2000 افزایش یافت که ژنوم انسان دارای ساختار هاپلوتایپ بلوک‌مانند است که توسط نقاط داغ نوترکیبی شکل گرفته است. پروژه HapMap سپس LD را در سراسر ژنوم فهرست‌بندی کرد و انتخاب SNP برچسب را امکان‌پذیر ساخت، که مستقیماً اولین آرایه‌های GWAS مقرون‌به‌صرفه را ممکن ساخت. پروژه 1000 ژنوم بعدها پانل‌های مرجع را به بسیاری از جمعیت‌ها گسترش داد، تکمیل داده‌ها را بهبود بخشید و نشان داد که الگوهای LD چگونه بر اساس تبار متفاوت هستند.

Debates

آیا الگوهای LD بین جمعیت‌ها منتقل می‌شوند؟
ساختار هاپلوتایپ و LD با تاریخچه جمعیت متفاوت است، بنابراین SNPهای برچسب و پانل‌های تکمیل داده که در یک تبار بهینه شده‌اند، تنوع را در تبار دیگر به طور ناقص ثبت می‌کنند، که به کاهش عملکرد آرایه‌ها و امتیازات مشتق شده از اروپایی‌ها در سایر جمعیت‌ها کمک می‌کند.

Key figures

  • Montgomery Slatkin
  • Mark Daly
  • David Altshuler
  • Goncalo Abecasis
  • William Bush

Related topics

Seminal works

  • slatkin-2008
  • hapmap-2007
  • 1000g-2015

Frequently asked questions

چگونه عدم تعادل پیوستگی به GWAS اجازه می‌دهد تنها برخی از واریانت‌ها را ژنوتیپ‌برداری کند؟
از آنجا که واریانت‌ها در یک بلوک هاپلوتایپ به شدت همبسته هستند، یک SNP برچسب ژنوتیپ‌برداری شده اطلاعاتی در مورد همسایگان ژنوتیپ‌نشده خود حمل می‌کند، بنابراین مجموعه‌ای از برچسب‌های خوب انتخاب شده بیشتر تنوع رایج در ژنوم را ثبت می‌کند.
تفاوت بین D' و r-squared چیست؟
D' اندازه‌گیری می‌کند که آیا نوترکیبی به طور تاریخی دو آلل را از هم جدا کرده است یا خیر، در حالی که r-squared اندازه‌گیری می‌کند که یک واریانت چقدر خوب واریانت دیگری را به صورت آماری پیش‌بینی می‌کند؛ r-squared کمیتی است که بیشترین ارتباط را با قدرت آزمایش ارتباطی مبتنی بر SNP برچسب دارد.

Methods for this concept

Related concepts