ScholarGate
المساعد

ضبط الجودة وتصحيح الأخطاء في التسلسل

تُنتج كل عملية تسلسل قراءات قاعدية بدرجات متفاوتة من الموثوقية، لذا فإن ضبط الجودة وتصحيح الأخطاء هما الخطوتان اللتان تحددان دقة كل قاعدة، وتقومان بتصفية أو تقليم البيانات منخفضة الجودة، وتصحيح الأخطاء المنهجية قبل تجميع القراءات أو استخدامها لتحديد المتغيرات. وبدون هذه الخطوات، يمكن أن تتشوه الاستنتاجات الجينومية اللاحقة بسبب الضوضاء التقنية بدلاً من البيولوجيا.

اعثر على موضوع باستخدام PaperMindقريبًاFind papers & topics
Tools & resources
تنزيل الشرائح
Learn & explore
فيديوقريبًا

Definition

ضبط الجودة في التسلسل هو تقييم وتحسين موثوقية القراءات، باستخدام درجات جودة كل قاعدة، وتقليم وتصفية، وطرق تصحيح الأخطاء لإزالة أو تصحيح الأخطاء التقنية بحيث يعكس التجميع وتحديد المتغيرات التسلسل الأساسي بدلاً من خطأ القياس.

Scope

يغطي هذا المدخل تسجيل جودة كل قاعدة (Phred)، وأنواع الأخطاء والتحيزات التي تؤثر على قراءات التسلسل، وتقليم وتصفية القراءات، ودور التغطية الزائدة في تمييز الإشارة الحقيقية عن الخطأ. إنه موضوع منهجي يتعلق بموثوقية البيانات ولا يقدم بروتوكولات سريرية أو مخبرية.

Core questions

  • كيف يتم تحديد موثوقية قراءة قاعدية فردية كميًا؟
  • ما هي أنواع الأخطاء والتحيزات التي تؤثر على قراءات التسلسل؟
  • كيف يقلل التقليم والتصفية والتغطية الزائدة من تأثير الأخطاء؟

Key concepts

  • درجة جودة Phred
  • دقة قراءة القاعدة
  • تقليم وتصفية القراءات
  • ملفات تعريف أخطاء التسلسل
  • التغطية وتقليل أخطاء التوافق
  • تقليم المحولات والجودة
  • التحكم في المتغيرات الإيجابية الكاذبة

Mechanisms

تُعيّن منصات التسلسل لكل قراءة قاعدية درجة جودة Phred، وهي تقدير لوغاريتمي لاحتمالية أن تكون القراءة خاطئة، مما يسمح بوضع علامة على القواعد ذات الثقة المنخفضة. ثم تقوم أدوات ضبط الجودة بتقليم المحولات (adapters) والنهايات منخفضة الجودة وتصفية القراءات غير الموثوقة قبل التحليل. ولأن الأخطاء عشوائية جزئيًا ومنهجية جزئيًا، فإن تسلسل كل موقع عدة مرات يسمح بالتوصل إلى توافق في الآراء بحيث يتم تجاوز الأخطاء المعزولة، بينما يساعد توصيف ملفات تعريف الأخطاء في تمييز الأخطاء المتكررة عن المتغيرات الحقيقية منخفضة التردد. تقلل هذه الخطوات من الإيجابيات الكاذبة في تحديد المتغيرات اللاحقة وتحسن دقة التجميع.

Clinical relevance

يحدد ضبط الجودة وتصحيح الأخطاء ما إذا كانت النتائج الجينومية تعكس تسلسلاً حقيقيًا أم ضوضاء تقنية، وهو أمر بالغ الأهمية حيثما يؤثر التسلسل على البحث أو التفسير السريري. هذا المدخل هو مادة مرجعية تعليمية حول موثوقية البيانات ولا يشكل إرشادات لأي اختبار محدد أو قرار سريري.

Evidence & guidelines

يتم توثيق هذه الطرق من خلال أوراق الأدوات والتحليل الأولية بدلاً من الإرشادات السريرية: أسس Ewing وزملاؤه (1998) درجة جودة Phred لكل قاعدة، وتُعد أداة Bolger وزملاؤه (2014) أداة مستخدمة على نطاق واسع لتقليم القراءات، ويصف Ma وزملاؤه (2019) ملفات تعريف الأخطاء في بيانات التسلسل العميق؛ وتربط المراجعات مثل Sims وزملاؤه (2014) التغطية بالتحكم في الأخطاء.

History

تم إضفاء الطابع الرسمي على تسجيل جودة كل قاعدة باستخدام برنامج Phred في عام 1998، مما أعطى بيانات التسلسل مقياسًا موحدًا وقابلاً للتفسير لثقة القراءة القاعدية أصبح عالميًا. ومع إنتاج منصات الإنتاجية العالية كميات هائلة من القراءات، ظهرت أدوات مخصصة للتقليم والتصفية في العقد الأول من القرن الحادي والعشرين، وصقلت التحليلات التفصيلية لملفات تعريف الأخطاء كيفية فصل المتغيرات الحقيقية منخفضة التردد عن الأخطاء المنهجية في التسلسل.

Key figures

  • Phil Green
  • Brent Ewing
  • Björn Usadel

Related topics

Seminal works

  • ewing-1998
  • bolger-2014
  • ma-2019

Frequently asked questions

ما هي درجة جودة Phred؟
هي مقياس لوغاريتمي للاحتمالية المقدرة بأن تكون قراءة القاعدة غير صحيحة؛ على سبيل المثال، درجة Phred 30 تتوافق مع حوالي 1 من كل 1000 فرصة للخطأ، لذا تشير الدرجات الأعلى إلى قراءات قاعدية أكثر موثوقية.
كيف يقلل تسلسل نفس الموقع عدة مرات من الأخطاء؟
عندما يغطي العديد من القراءات المستقلة موقعًا ما، يمكن تجاوز الأخطاء العشوائية في القراءات الفردية من قبل الأغلبية، لذا فإن التوصل إلى توافق في الآراء عبر القراءات ينتج قراءة قاعدية أكثر دقة من أي قراءة فردية.

Methods for this concept

Related concepts