تفسیر عملکردی واریانتهای ژنومی
توالییابی یک ژنوم میلیونها واریانت را به دست میدهد، اما بیشتر آنها پیامدهای ناشناختهای دارند. تفسیر عملکردی فرآیند نسبت دادن معنای بیولوژیکی به هر واریانت است — اینکه در کجا قرار میگیرد، چه ژن یا عنصر تنظیمی را تحت تأثیر قرار میدهد، و چقدر احتمال دارد که عملکرد را تغییر دهد — تا بتوان تعداد کمی از واریانتهای مهم را از تعداد زیادی که مهم نیستند، متمایز کرد.
Definition
تفسیر عملکردی واریانتهای ژنومی، تخصیص زمینه بیولوژیکی و پیامد عملکردی پیشبینیشده به واریانتهای توالی است، از جمله مکان ژنومی آنها، ژنها یا عناصر تنظیمی تحت تأثیر، اثر مولکولی (مانند میسسنس، نانسسنس، تغییردهنده پیرایش، یا تنظیمی)، و تأثیر پیشبینیشده بر عملکرد.
Scope
این موضوع به تفسیر واریانتهای تکنوکلئوتیدی، درجها، حذفها و تغییرات ساختاری میپردازد: مکانیابی واریانتها نسبت به ژنها و مناطق تنظیمی، طبقهبندی پیامدهای مولکولی آنها، و پیشبینی مضر بودن برای جایگاههای کدکننده و غیرکدکننده. این موضوع تفسیر را به عنوان یک مبحث روششناختی و مرجع در نظر میگیرد و تفسیری از واریانتها برای موارد بالینی فردی ارائه نمیدهد.
Core questions
- یک واریانت نسبت به ژنها، اگزونها، جایگاههای پیرایش و عناصر تنظیمی در کجا قرار میگیرد؟
- پیامد مولکولی آن چیست — آیا پروتئین را تغییر میدهد، پیرایش را مختل میکند یا بر تنظیم تأثیر میگذارد؟
- چقدر احتمال دارد که واریانت برای عملکرد مضر باشد؟
- چگونه میتوان واریانتهای غیرکدکننده را، که فاقد یک خوانش ساده تغییردهنده پروتئین هستند، تفسیر کرد؟
Key concepts
- مکان واریانت و طبقهبندی پیامد
- واریانتهای میسسنس، نانسسنس، تغییر چارچوب و پیرایش
- پیشبینی مضر بودن برای واریانتهای کدکننده
- تفسیر واریانتهای غیرکدکننده و تنظیمی
- منابع تفسیر مرجع (مدلهای ژنی، حفظ توالی، نقشههای عناصر عملکردی)
- جایگاههای صفت کمی بیان (eQTLs)
Mechanisms
خطوط لوله تفسیر ابتدا هر واریانت را بر روی یک ژنوم مرجع و مجموعهای از مدلهای ژنی نگاشت میکنند تا موقعیت و پیامد اساسی آن را تعیین کنند — اینکه آیا در یک اگزون کدکننده، یک جایگاه پیرایش، یک منطقه ترجمهنشده، یا یک منطقه بینژنی قرار دارد — با استفاده از ابزارهایی مانند ANNOVAR و SnpEff. برای واریانتهای کدکنندهای که یک اسید آمینه را تغییر میدهند، الگوریتمهای پیشبینی مانند SIFT تخمین میزنند که آیا جایگزینی تحمل میشود یا مضر است، با تکیه بر حفظ توالی در گونهها. تفسیر واریانتهای غیرکدکننده دشوارتر است زیرا پروتئین را تغییر نمیدهند؛ در اینجا تفسیر به نقشههای عناصر عملکردی مانند موارد ENCODE و ارتباط بین واریانتهای ژنتیکی و بیان ژن (eQTLs) که توسط پروژههایی مانند GTEx فهرستبندی شدهاند، متکی است. خروجی، توصیفی لایهای از هر واریانت است که از اولویتبندی بعدی پشتیبانی میکند.
Clinical relevance
تفسیر واریانت یک گام اساسی در تحقیقات ژنومی و در خطوط لوله تحلیلی مورد استفاده برای تفسیر دادههای توالییابی است. این فرآیند نحوه شناسایی و اولویتبندی واریانتهای کاندید را توصیف میکند؛ پیشبینیهایی که تولید میکند فرضیههای محاسباتی هستند و به خودی خود، تعیین بیماریزایی یا مبنایی برای تصمیمات تشخیصی یا درمانی فردی نیستند.
History
با تبدیل شدن توالییابی با توان بالا به یک روش معمول برای دادههای اگزوم کامل و ژنوم کامل در اواخر دهه 2000، گلوگاه از تولید واریانتها به تفسیر آنها تغییر یافت. پیشبینیکنندههای مبتنی بر حفظ توالی مانند SIFT (2009) به واریانتهای کدکننده پرداختند، در حالی که موتورهای تفسیر عمومی مانند ANNOVAR (2010) و SnpEff (2012) تخصیص پیامد را در انواع واریانتها سیستماتیک کردند. کاتالوگهای بزرگ عناصر عملکردی مانند ENCODE (2012) و منابع بیان ژن مانند GTEx (2015) سپس تفسیر را به ژنوم غیرکدکننده، که بخش عمدهای از تغییرات را تشکیل میدهد، گسترش دادند.
Debates
- واریانتهای غیرکدکننده چگونه باید تفسیر شوند؟
- واریانتهای کدکننده دارای یک خوانش مولکولی نسبتاً قابل تفسیر هستند، اما بیشتر تغییرات غیرکدکننده هستند و فاقد پیامد مستقیم پروتئینی میباشند؛ تفسیر آنها به نقشههای عناصر عملکردی و شواهد eQTLs بستگی دارد که کامل بودن و اختصاصیت بافتی آنها همچنان محدودکننده است.
Key figures
- Kai Wang
- Pauline Ng
- Steven Henikoff
- Pablo Cingolani
Related topics
Seminal works
- kumar-2009
- wang-2010
- cingolani-2012
- encode-2012
Frequently asked questions
- تفسیر یک واریانت به چه معناست؟
- به معنای نسبت دادن زمینه بیولوژیکی به واریانت است: اینکه در کجا نسبت به ژنها و عناصر تنظیمی قرار میگیرد، چه پیامد مولکولی دارد، و چقدر احتمال دارد که بر عملکرد تأثیر بگذارد — تا بتوان واریانتهای مهم را از واریانتهای خنثی تشخیص داد.
- چرا تفسیر واریانتهای غیرکدکننده دشوارتر از واریانتهای کدکننده است؟
- واریانتهای کدکننده را میتوان در برابر کد ژنتیکی خواند تا تغییر پروتئین را پیشبینی کرد، اما واریانتهای غیرکدکننده چنین خوانش مستقیمی ندارند؛ تفسیر آنها به نقشههای عناصر تنظیمی و ارتباط بین واریانتها و بیان ژن متکی است که هنوز ناقص هستند.