ScholarGate
دستیار

کنترل کیفیت و تصحیح خطا در توالی‌یابی

هر اجرای توالی‌یابی، فراخوانی‌های بازی با قابلیت اطمینان متغیر تولید می‌کند؛ بنابراین، کنترل کیفیت و تصحیح خطا مراحلی هستند که دقت هر باز را کمی‌سازی می‌کنند، داده‌های با کیفیت پایین را فیلتر یا برش می‌دهند و مصنوعات سیستماتیک را قبل از مونتاژ خوانش‌ها یا استفاده از آن‌ها برای فراخوانی واریانت‌ها، تصحیح می‌کنند. بدون این مراحل، نتایج ژنومی پایین‌دستی ممکن است به جای زیست‌شناسی، توسط نویز فنی تحریف شوند.

یافتن موضوع با PaperMindبه‌زودیFind papers & topics
Tools & resources
دریافت اسلایدها
Learn & explore
ویدیوبه‌زودی

Definition

کنترل کیفیت در توالی‌یابی، ارزیابی و بهبود قابلیت اطمینان خوانش‌ها است که با استفاده از امتیازات کیفیت هر باز، برش و فیلتر کردن، و روش‌های تصحیح خطا برای حذف یا تصحیح مصنوعات فنی انجام می‌شود تا مونتاژ و فراخوانی واریانت‌ها، توالی زیربنایی را به جای خطای اندازه‌گیری منعکس کند.

Scope

این مدخل به امتیازدهی کیفیت هر باز (Phred)، انواع خطاها و سوگیری‌هایی که بر خوانش‌های توالی‌یابی تأثیر می‌گذارند، برش و فیلتر کردن خوانش‌ها، و نقش پوشش اضافی در تمایز سیگنال واقعی از خطا می‌پردازد. این یک موضوع روش‌شناختی در مورد قابلیت اطمینان داده‌ها است و پروتکل‌های بالینی یا آزمایشگاهی را ارائه نمی‌دهد.

Core questions

  • قابلیت اطمینان یک فراخوانی باز منفرد چگونه کمی‌سازی می‌شود؟
  • چه نوع خطاها و سوگیری‌هایی بر خوانش‌های توالی‌یابی تأثیر می‌گذارند؟
  • برش، فیلتر کردن و پوشش اضافی چگونه تأثیر خطاها را کاهش می‌دهند؟

Key concepts

  • امتیاز کیفیت Phred
  • دقت فراخوانی باز
  • برش و فیلتر کردن خوانش
  • پروفایل‌های خطای توالی‌یابی
  • کاهش خطای پوشش و اجماع
  • برش آداپتور و کیفیت
  • کنترل واریانت‌های مثبت کاذب

Mechanisms

پلتفرم‌های توالی‌یابی به هر فراخوانی باز یک امتیاز کیفیت Phred اختصاص می‌دهند، که یک تخمین لگاریتمی از احتمال اشتباه بودن فراخوانی است و امکان علامت‌گذاری بازهای با اطمینان پایین را فراهم می‌کند. ابزارهای کنترل کیفیت سپس آداپتورها و انتهای با کیفیت پایین را برش می‌دهند و خوانش‌های غیرقابل اعتماد را قبل از تحلیل فیلتر می‌کنند. از آنجا که خطاها تا حدی تصادفی و تا حدی سیستماتیک هستند، توالی‌یابی هر موقعیت برای دفعات زیاد امکان دستیابی به یک اجماع را فراهم می‌کند تا خطاهای منفرد نادیده گرفته شوند، در حالی که توصیف پروفایل‌های خطا به تمایز مصنوعات تکراری از واریانت‌های واقعی با فرکانس پایین کمک می‌کند. این مراحل، مثبت کاذب را در فراخوانی واریانت‌های پایین‌دستی کاهش می‌دهند و دقت مونتاژ را بهبود می‌بخشند.

Clinical relevance

کنترل کیفیت و تصحیح خطا تعیین می‌کنند که آیا یافته‌های ژنومی منعکس‌کننده توالی واقعی هستند یا نویز فنی، که در هر جایی که توالی‌یابی به تحقیق یا تفسیر بالینی کمک می‌کند، حیاتی است. این مدخل یک منبع آموزشی مرجع در مورد قابلیت اطمینان داده‌ها است و راهنمایی برای هیچ آزمایش خاص یا تصمیم بالینی محسوب نمی‌شود.

Evidence & guidelines

این روش‌ها از طریق مقالات اصلی ابزار و تحلیل، و نه دستورالعمل‌های بالینی، مستند شده‌اند: اوینگ و همکاران (1998) امتیاز کیفیت Phred برای هر باز را ایجاد کردند، بولگر و همکاران (2014) یک ابزار برش خوانش پرکاربرد است، و ما و همکاران (2019) پروفایل‌های خطا را در داده‌های توالی‌یابی عمیق توصیف می‌کنند؛ بررسی‌هایی مانند سیمز و همکاران (2014) پوشش را به کنترل خطا مرتبط می‌کنند.

History

امتیازدهی کیفیت هر باز با برنامه Phred در سال 1998 رسمی شد و به داده‌های توالی‌یابی یک معیار استاندارد و قابل تفسیر از اطمینان فراخوانی باز داد که جهانی شد. با تولید حجم وسیعی از خوانش‌ها توسط پلتفرم‌های با توان عملیاتی بالا، ابزارهای اختصاصی برش و فیلتر کردن در دهه 2010 پدید آمدند، و تحلیل‌های دقیق پروفایل‌های خطا، نحوه جداسازی واریانت‌های واقعی با فرکانس پایین از مصنوعات توالی‌یابی سیستماتیک را بهبود بخشیدند.

Key figures

  • Phil Green
  • Brent Ewing
  • Björn Usadel

Related topics

Seminal works

  • ewing-1998
  • bolger-2014
  • ma-2019

Frequently asked questions

امتیاز کیفیت Phred چیست؟
این یک معیار لگاریتمی از احتمال تخمینی نادرست بودن یک فراخوانی باز است؛ به عنوان مثال، امتیاز Phred 30 تقریباً معادل 1 در 1000 احتمال خطا است، بنابراین امتیازات بالاتر نشان‌دهنده فراخوانی‌های باز قابل اطمینان‌تر هستند.
توالی‌یابی یک موقعیت برای دفعات زیاد چگونه خطاها را کاهش می‌دهد؟
هنگامی که یک موقعیت توسط بسیاری از خوانش‌های مستقل پوشش داده می‌شود، خطاهای تصادفی در خوانش‌های منفرد می‌توانند توسط اکثریت نادیده گرفته شوند، بنابراین دستیابی به یک اجماع در میان خوانش‌ها، فراخوانی باز دقیق‌تری نسبت به هر خوانش منفرد به دست می‌دهد.

Methods for this concept

Related concepts