توالییابی ژنوم، مونتاژ، و استانداردهای مرجع
این حوزه به چگونگی خوانش ترتیب نوکلئوتیدها در ژنوم، بازسازی قطعات حاصل به توالیهای پیوسته بلندتر، و نحوه ساخت و نگهداری ژنومهای مرجع تنظیمشده میپردازد تا دادههای جدید بتوانند بر اساس یک استاندارد مشترک همتراز و تفسیر شوند. این مراحل در کنار هم، اساس فنی تقریباً تمام علم ژنومیک را تشکیل میدهند.
Definition
توالییابی ژنوم عبارت است از تعیین ترتیب نوکلئوتیدهای DNA یک ارگانیسم؛ مونتاژ عبارت است از بازسازی محاسباتی خوانشهای توالی همپوشان به توالیهای پیوسته بلندتر؛ و استانداردهای مرجع، مونتاژها و حاشیهنویسیهای ژنومی تنظیمشده و نسخهبندیشدهای هستند که دادههای توالی جدید بر اساس آنها همتراز و مقایسه میشوند.
Scope
این حوزه شامل شیمیهای توالییابی از توالییابی دیدئوکسی سنگر تا پلتفرمهای پرتوان خوانش کوتاه و خوانش بلند، مونتاژ محاسباتی خوانشها به کانتیکها و اسکافولدها، ساخت و حاشیهنویسی ژنومهای مرجع مانند GRCh38 و مونتاژ تلومر-به-تلومر، و مراحل کنترل کیفیت و تصحیح خطا است که قابلیت اطمینان دادهها را تعیین میکنند. این موارد به عنوان موضوعات روششناختی و زیرساختی در نظر گرفته میشوند، نه رویههای بالینی.
Sub-topics
Core questions
- ترتیب نوکلئوتیدهای یک ژنوم چگونه تعیین میشود و شیمیهای توالییابی چگونه تکامل یافتهاند؟
- خوانشهای توالی کوتاه یا بلند چگونه به یک ژنوم کامل بازسازی میشوند؟
- چه چیزی یک مونتاژ ژنوم را به یک مرجع قابل استفاده تبدیل میکند و چگونه نسخهبندی و حاشیهنویسی میشود؟
- خطاهای توالییابی چگونه شناسایی، کمیسازی و تصحیح میشوند تا تحلیلهای بعدی قابل اعتماد باشند؟
Key concepts
- خوانش (Read)، کانتیک (contig)، و اسکافولد (scaffold)
- پوشش (Coverage) و عمق توالییابی (sequencing depth)
- توالییابی خوانش کوتاه در مقابل خوانش بلند
- مونتاژ de novo در مقابل همترازی با راهنمایی مرجع
- ژنوم مرجع و ساخت ژنوم (مانند GRCh38)
- حاشیهنویسی ژنوم (Genome annotation)
- امتیاز کیفیت هر باز (Phred)
Mechanisms
پلتفرمهای توالییابی، DNA فیزیکی را به فراخوانیهای باز (base calls) قابل خوانش توسط ماشین تبدیل میکنند که هر یک با تخمین کیفی همراه است. از آنجا که بیشتر پلتفرمها تنها قطعاتی بسیار کوتاهتر از یک کروموزوم را میخوانند، این قطعات باید مونتاژ شوند: مونتاژ de novo ژنوم را از همپوشانی خوانشها بازسازی میکند (از نظر تاریخی همپوشانی-چیدمان-اجماع، اکنون اغلب گرافهای de Bruijn برای خوانشهای کوتاه)، در حالی که تحلیل با راهنمایی مرجع، خوانشها را با یک مونتاژ موجود همتراز میکند. ژنوم مرجع یک توالی اجماعی تنظیمشده است که به صورت ساختهای متوالی نسخهبندی شده و با حاشیهنویسی لایهبندی شده است و سیستم مختصات را برای این حوزه فراهم میکند. کنترل کیفیت و تصحیح خطا در کل خط لوله قرار دارند و دقت هر باز را تخمین میزنند و مصنوعات را قبل از فراخوانی واریانتها حذف یا تصحیح میکنند.
Clinical relevance
توالییابی، مونتاژ و استانداردهای مرجع قابل اعتماد، زیربنای ژنومیک بالینی و تحقیقاتی هستند، زیرا تفسیر واریانتها به خوانشهای دقیق همتراز شده با یک مرجع به خوبی مشخص شده بستگی دارد. این حوزه زیرساختی را توصیف میکند که شواهد ژنومی را تولید میکند؛ این یک ماده مرجع و آموزشی است و مبنایی برای تصمیمات تشخیصی یا درمانی فردی نیست.
Evidence & guidelines
روشهای اینجا از طریق مطالعات اولیه برجسته و گزارشهای کنسرسیوم مستند شدهاند تا دستورالعملهای بالینی: روش خاتمه زنجیره سنگر (1977)، پیشنویس پروژه ژنوم انسانی (2001)، بررسی پلتفرمهای نسل بعدی (Metzker, 2010)، و ژنوم کامل تلومر-به-تلومر انسانی (Nurk et al., 2022) مسیر این حوزه را ترسیم میکنند.
History
توالییابی DNA با شیمی خاتمه زنجیره سنگر در سال 1977 آغاز شد، که امکان خوانش اولین ژنومها را فراهم کرد و پیشنویس توالی پروژه ژنوم انسانی را در سال 2001 به حرکت درآورد. ظهور بعدی پلتفرمهای پرتوان (نسل بعدی) هزینهها را به میزان قابل توجهی کاهش داد، و فناوریهای خوانش بلند بعداً مناطق تکراری را حل کردند، که در نهایت منجر به اولین ژنوم کامل و بدون شکاف انسانی در سال 2022 شد.
Key figures
- Frederick Sanger
- Eric Lander
- Michael Metzker
- Sergey Koren
- Adam Phillippy
Related topics
Seminal works
- sanger-1977
- ihgsc-2001
- metzker-2009
- nurk-2022
Frequently asked questions
- تفاوت بین توالییابی و مونتاژ چیست؟
- توالییابی ترتیب نوکلئوتیدها را در قطعات DNA میخواند، در حالی که مونتاژ مرحله محاسباتی است که آن قطعات را به توالیهای پیوسته بلندتر مانند کانتیکها، اسکافولدها یا کروموزومهای کامل بازسازی میکند.
- چرا این حوزه به یک ژنوم مرجع نیاز دارد؟
- یک ژنوم مرجع یک سیستم مختصات مشترک و نسخهبندی شده را فراهم میکند تا دادههای توالی جدید از افراد و آزمایشگاههای مختلف بتوانند به طور سازگار همتراز، مقایسه و تفسیر شوند.