کنترل کیفیت و تصحیح خطا در توالییابی
هر اجرای توالییابی، فراخوانیهای بازی با قابلیت اطمینان متغیر تولید میکند؛ بنابراین، کنترل کیفیت و تصحیح خطا مراحلی هستند که دقت هر باز را کمیسازی میکنند، دادههای با کیفیت پایین را فیلتر یا برش میدهند و مصنوعات سیستماتیک را قبل از مونتاژ خوانشها یا استفاده از آنها برای فراخوانی واریانتها، تصحیح میکنند. بدون این مراحل، نتایج ژنومی پاییندستی ممکن است به جای زیستشناسی، توسط نویز فنی تحریف شوند.
Definition
کنترل کیفیت در توالییابی، ارزیابی و بهبود قابلیت اطمینان خوانشها است که با استفاده از امتیازات کیفیت هر باز، برش و فیلتر کردن، و روشهای تصحیح خطا برای حذف یا تصحیح مصنوعات فنی انجام میشود تا مونتاژ و فراخوانی واریانتها، توالی زیربنایی را به جای خطای اندازهگیری منعکس کند.
Scope
این مدخل به امتیازدهی کیفیت هر باز (Phred)، انواع خطاها و سوگیریهایی که بر خوانشهای توالییابی تأثیر میگذارند، برش و فیلتر کردن خوانشها، و نقش پوشش اضافی در تمایز سیگنال واقعی از خطا میپردازد. این یک موضوع روششناختی در مورد قابلیت اطمینان دادهها است و پروتکلهای بالینی یا آزمایشگاهی را ارائه نمیدهد.
Core questions
- قابلیت اطمینان یک فراخوانی باز منفرد چگونه کمیسازی میشود؟
- چه نوع خطاها و سوگیریهایی بر خوانشهای توالییابی تأثیر میگذارند؟
- برش، فیلتر کردن و پوشش اضافی چگونه تأثیر خطاها را کاهش میدهند؟
Key concepts
- امتیاز کیفیت Phred
- دقت فراخوانی باز
- برش و فیلتر کردن خوانش
- پروفایلهای خطای توالییابی
- کاهش خطای پوشش و اجماع
- برش آداپتور و کیفیت
- کنترل واریانتهای مثبت کاذب
Mechanisms
پلتفرمهای توالییابی به هر فراخوانی باز یک امتیاز کیفیت Phred اختصاص میدهند، که یک تخمین لگاریتمی از احتمال اشتباه بودن فراخوانی است و امکان علامتگذاری بازهای با اطمینان پایین را فراهم میکند. ابزارهای کنترل کیفیت سپس آداپتورها و انتهای با کیفیت پایین را برش میدهند و خوانشهای غیرقابل اعتماد را قبل از تحلیل فیلتر میکنند. از آنجا که خطاها تا حدی تصادفی و تا حدی سیستماتیک هستند، توالییابی هر موقعیت برای دفعات زیاد امکان دستیابی به یک اجماع را فراهم میکند تا خطاهای منفرد نادیده گرفته شوند، در حالی که توصیف پروفایلهای خطا به تمایز مصنوعات تکراری از واریانتهای واقعی با فرکانس پایین کمک میکند. این مراحل، مثبت کاذب را در فراخوانی واریانتهای پاییندستی کاهش میدهند و دقت مونتاژ را بهبود میبخشند.
Clinical relevance
کنترل کیفیت و تصحیح خطا تعیین میکنند که آیا یافتههای ژنومی منعکسکننده توالی واقعی هستند یا نویز فنی، که در هر جایی که توالییابی به تحقیق یا تفسیر بالینی کمک میکند، حیاتی است. این مدخل یک منبع آموزشی مرجع در مورد قابلیت اطمینان دادهها است و راهنمایی برای هیچ آزمایش خاص یا تصمیم بالینی محسوب نمیشود.
Evidence & guidelines
این روشها از طریق مقالات اصلی ابزار و تحلیل، و نه دستورالعملهای بالینی، مستند شدهاند: اوینگ و همکاران (1998) امتیاز کیفیت Phred برای هر باز را ایجاد کردند، بولگر و همکاران (2014) یک ابزار برش خوانش پرکاربرد است، و ما و همکاران (2019) پروفایلهای خطا را در دادههای توالییابی عمیق توصیف میکنند؛ بررسیهایی مانند سیمز و همکاران (2014) پوشش را به کنترل خطا مرتبط میکنند.
History
امتیازدهی کیفیت هر باز با برنامه Phred در سال 1998 رسمی شد و به دادههای توالییابی یک معیار استاندارد و قابل تفسیر از اطمینان فراخوانی باز داد که جهانی شد. با تولید حجم وسیعی از خوانشها توسط پلتفرمهای با توان عملیاتی بالا، ابزارهای اختصاصی برش و فیلتر کردن در دهه 2010 پدید آمدند، و تحلیلهای دقیق پروفایلهای خطا، نحوه جداسازی واریانتهای واقعی با فرکانس پایین از مصنوعات توالییابی سیستماتیک را بهبود بخشیدند.
Key figures
- Phil Green
- Brent Ewing
- Björn Usadel
Related topics
Seminal works
- ewing-1998
- bolger-2014
- ma-2019
Frequently asked questions
- امتیاز کیفیت Phred چیست؟
- این یک معیار لگاریتمی از احتمال تخمینی نادرست بودن یک فراخوانی باز است؛ به عنوان مثال، امتیاز Phred 30 تقریباً معادل 1 در 1000 احتمال خطا است، بنابراین امتیازات بالاتر نشاندهنده فراخوانیهای باز قابل اطمینانتر هستند.
- توالییابی یک موقعیت برای دفعات زیاد چگونه خطاها را کاهش میدهد؟
- هنگامی که یک موقعیت توسط بسیاری از خوانشهای مستقل پوشش داده میشود، خطاهای تصادفی در خوانشهای منفرد میتوانند توسط اکثریت نادیده گرفته شوند، بنابراین دستیابی به یک اجماع در میان خوانشها، فراخوانی باز دقیقتری نسبت به هر خوانش منفرد به دست میدهد.