تنوع نوکلئوتیدی و طبقهبندی واریانت
تنوع نوکلئوتیدی میزان تفاوت متوسط بین دو توالی انتخابشده تصادفی از یک جمعیت را اندازهگیری میکند، در حالی که طبقهبندی واریانت، انواع مختلف تفاوتهای DNA — جایگزینیهای تکنوکلئوتیدی، درجها و حذفهای کوچک، و تغییرات ساختاری بزرگتر — را در یک واژگان سازگار سازماندهی میکند. این دو با هم، هم میزان تنوعی که یک ژنوم حمل میکند و هم شکل آن تنوع را توصیف میکنند.
Definition
تنوع نوکلئوتیدی (که معمولاً با pi نشان داده میشود) میانگین تعداد تفاوتهای نوکلئوتیدی در هر جایگاه بین دو توالی نمونهبرداریشده از یک جمعیت است؛ طبقهبندی واریانت، دستهبندی سیستماتیک تفاوتهای توالی مشاهدهشده (مانند واریانتهای تکنوکلئوتیدی، ایندلها، واریانتهای ساختاری) است.
Scope
این مدخل، معیارهای خلاصه استاندارد تغییرات توالی درونجمعیتی، بهویژه تنوع نوکلئوتیدی و تعداد جایگاههای تفکیکشونده، و طبقهبندی انواع واریانتها بر اساس اندازه و اثر پیشبینیشده بر توالی را پوشش میدهد. این مفاهیم را به عنوان مفاهیم توصیفی و روششناختی بررسی میکند؛ و به واریانتهای خاص اهمیت بالینی نمیدهد.
Core questions
- میزان تنوع توالی در یک نمونه چگونه خلاصه میشود؟
- تنوع نوکلئوتیدی و تعداد جایگاههای تفکیکشونده به عنوان برآوردگرها چه تفاوتی دارند؟
- دستههای اصلی واریانت ژنتیکی بر اساس اندازه و نوع کدامند؟
- واریانتها چگونه در یک قالب فایل استاندارد نمایش داده و مبادله میشوند؟
Key concepts
- تنوع نوکلئوتیدی (pi)
- جایگاههای تفکیکشونده و تتای واترسون
- واریانت تکنوکلئوتیدی (SNV/SNP)
- درج-حذف (indel)
- واریانت ساختاری
- آللهای مرجع و جایگزین
- قالب فراخوانی واریانت (VCF)
Key theories
- مدل جایگاههای نامحدود و تتا
- بر اساس فرض جایگاههای نامحدود، هر جهش جدید در یک جایگاه که قبلاً جهشیافته نبوده رخ میدهد، بنابراین پارامتر جهش جمعیتی تتا را میتوان هم از تعداد جایگاههای تفکیکشونده (برآوردگر واترسون) و هم از میانگین تفاوتهای جفتی (تنوع نوکلئوتیدی) برآورد کرد؛ اختلاف سیستماتیک بین این دو، اطلاعاتی در مورد انحرافات از خنثی بودن ارائه میدهد.
Mechanisms
تنوع ابتدا با همتراز کردن توالیهای خواندهشده با یک ژنوم مرجع و شناسایی موقعیتهای متفاوت شناسایی میشود؛ سپس تفاوتها بر اساس اندازه و شکل طبقهبندی میشوند. آمار خلاصه این را به معیارهای سطح جمعیت فشرده میکند: تعداد جایگاههای تفکیکشونده زیربنای برآوردگر تتا واترسون است، در حالی که میانگین تفاوتهای جفتی تنوع نوکلئوتیدی را تعریف میکند. از آنجا که هر دو پارامتر یکسانی را تحت یک مدل خنثی و با اندازه ثابت برآورد میکنند، تفاوت آنها (که توسط تاجیما رسمی شده است) تغییرات جمعیتی یا انتخاب را نشان میدهد. نمایش استاندارد در قالب فراخوانی واریانت (Variant Call Format) امکان ذخیره، اشتراکگذاری و مقایسه واریانتها را در مطالعات مختلف فراهم میکند.
Clinical relevance
یک واژگان واریانت سازگار و برآوردهای قابل اعتماد تنوع، پیشنیازهایی برای تفسیر دادههای ژنومی در محیطهای بهداشتی هستند، زیرا همان دستهبندیهای توصیفی هنگام غربالگری یک ژنوم توالییابیشده برای واریانتهای بالینی مرتبط استفاده میشوند. این مدخل توضیح میدهد که چگونه واریانتها توصیف و شمارش میشوند و مبنایی برای تصمیمگیریهای تشخیصی یا درمانی فردی نیست.
Evidence & guidelines
برآوردگرهای بنیادی تنوع توالی توسط واترسون و تاجیما ایجاد شدند، در حالی که بررسیهای بزرگ مانند نقشه اولیه SNP انسانی و مرجع پروژه 1000 ژنوم، مقیاس تجربی تنوع انسانی را ارائه میدهند. قالب فراخوانی واریانت (Variant Call Format) و ابزارهای آن، استاندارد عملی جامعه برای نمایش واریانتهای طبقهبندیشده هستند.
History
ژنتیک جمعیت مولکولی اولیه، تنوع را از طریق بررسیهای آلوآنزیم و جایگاههای برش، و سپس از طریق توالییابی DNA کمیسازی کرد. کارهای واترسون در سال 1975 و تاجیما در سال 1989 برآوردگرهایی را ارائه دادند که هنوز امروزه استفاده میشوند، و نقشه SNP انسانی در سال 2001 و کنسرسیومهای توالییابی بعدی، فهرستبندی واریانتها را به یک فعالیت در سطح ژنوم تبدیل کردند که با فرمتهای استانداردی مانند VCF برای نمایش واریانتهای حاصل همراه بود.
Key figures
- G. A. Watterson
- Fumio Tajima
- Richard Durbin
- Gonçalo Abecasis
Related topics
Seminal works
- watterson-1975
- tajima-1989
- snp-map-2001
Frequently asked questions
- تفاوت بین تنوع نوکلئوتیدی و تعداد جایگاههای تفکیکشونده چیست؟
- تعداد جایگاههای تفکیکشونده تعداد موقعیتهایی را که در یک نمونه متفاوت هستند، شمارش میکند، در حالی که تنوع نوکلئوتیدی میانگین تفاوتها بین جفت توالیها را محاسبه میکند؛ هر دو پارامتر زیربنایی یکسانی را تحت یک مدل خنثی ساده برآورد میکنند، و اختلاف آنها به خودی خود آموزنده است.
- آیا SNP همان جهش است؟
- SNP یک واریانت تکنوکلئوتیدی است که در یک جمعیت در حال تفکیک مشاهده میشود؛ این واریانت از یک جهش نقطهای منشأ میگیرد، اما این اصطلاح تأکید میکند که واریانت با فراوانی قابل توجهی وجود دارد، نه اینکه یک تغییر تازه ایجاد شده در یک فرد باشد.