Kontrol Kualitas dan Koreksi Kesalahan dalam Sekuensing
Setiap proses sekuensing menghasilkan panggilan basa dengan keandalan yang bervariasi, sehingga kontrol kualitas dan koreksi kesalahan adalah langkah-langkah yang mengukur akurasi per-basa, menyaring atau memangkas data berkualitas rendah, dan mengoreksi artefak sistematis sebelum pembacaan dirakit atau digunakan untuk penentuan varian. Tanpa langkah-langkah ini, kesimpulan genomik selanjutnya dapat terdistorsi oleh kebisingan teknis daripada biologi.
Definition
Kontrol kualitas dalam sekuensing adalah penilaian dan peningkatan keandalan pembacaan, menggunakan skor kualitas per-basa, pemangkasan dan penyaringan, serta metode koreksi kesalahan untuk menghilangkan atau mengoreksi artefak teknis sehingga perakitan dan penentuan varian mencerminkan urutan yang mendasari daripada kesalahan pengukuran.
Scope
Entri ini mencakup penilaian kualitas per-basa (Phred), jenis-jenis kesalahan dan bias yang memengaruhi pembacaan sekuensing, pemangkasan dan penyaringan pembacaan, serta peran cakupan redundan dalam membedakan sinyal sejati dari kesalahan. Ini adalah topik metodologis tentang keandalan data dan tidak menyediakan protokol klinis atau laboratorium.
Core questions
- Bagaimana keandalan panggilan basa individual diukur?
- Jenis kesalahan dan bias apa yang memengaruhi pembacaan sekuensing?
- Bagaimana pemangkasan, penyaringan, dan cakupan redundan mengurangi dampak kesalahan?
Key concepts
- Skor kualitas Phred
- Akurasi panggilan basa
- Pemangkasan dan penyaringan pembacaan
- Profil kesalahan sekuensing
- Cakupan dan pengurangan kesalahan konsensus
- Pemangkasan adaptor dan kualitas
- Kontrol varian positif palsu
Mechanisms
Platform sekuensing menetapkan setiap panggilan basa skor kualitas Phred, estimasi logaritmik probabilitas bahwa panggilan tersebut salah, yang memungkinkan basa dengan kepercayaan rendah ditandai. Alat kontrol kualitas kemudian memangkas adaptor dan ujung berkualitas rendah serta menyaring pembacaan yang tidak dapat diandalkan sebelum analisis. Karena kesalahan sebagian bersifat acak dan sebagian sistematis, sekuensing setiap posisi berkali-kali memungkinkan konsensus diambil sehingga kesalahan terisolasi dapat diatasi oleh mayoritas, sementara karakterisasi profil kesalahan membantu membedakan artefak berulang dari varian frekuensi rendah yang asli. Langkah-langkah ini mengurangi positif palsu dalam penentuan varian selanjutnya dan meningkatkan akurasi perakitan.
Clinical relevance
Kontrol kualitas dan koreksi kesalahan menentukan apakah temuan genomik mencerminkan urutan sejati atau kebisingan teknis, yang sangat penting di mana pun sekuensing menginformasikan penelitian atau interpretasi klinis. Entri ini adalah materi referensi edukasi tentang keandalan data dan bukan merupakan panduan untuk tes spesifik atau keputusan klinis apa pun.
Evidence & guidelines
Metode-metode ini didokumentasikan melalui makalah alat primer dan analisis daripada pedoman klinis: Ewing et al. (1998) menetapkan skor kualitas per-basa Phred, Bolger et al. (2014) adalah alat pemangkasan pembacaan yang banyak digunakan, dan Ma et al. (2019) mengkarakterisasi profil kesalahan dalam data sekuensing mendalam; tinjauan seperti Sims et al. (2014) menghubungkan cakupan dengan kontrol kesalahan.
History
Penilaian kualitas per-basa diformalkan dengan program Phred pada tahun 1998, memberikan data sekuensing ukuran standar dan dapat diinterpretasikan tentang kepercayaan panggilan basa yang menjadi universal. Ketika platform berthroughput tinggi menghasilkan volume pembacaan yang besar, alat pemangkasan dan penyaringan khusus muncul pada tahun 2010-an, dan analisis rinci profil kesalahan menyempurnakan cara varian frekuensi rendah yang asli dipisahkan dari artefak sekuensing sistematis.
Key figures
- Phil Green
- Brent Ewing
- Björn Usadel
Related topics
Seminal works
- ewing-1998
- bolger-2014
- ma-2019
Frequently asked questions
- Apa itu skor kualitas Phred?
- Ini adalah ukuran logaritmik dari perkiraan probabilitas bahwa panggilan basa salah; misalnya, skor Phred 30 sesuai dengan sekitar 1 dari 1000 kemungkinan kesalahan, sehingga skor yang lebih tinggi menunjukkan panggilan basa yang lebih andal.
- Bagaimana sekuensing posisi yang sama berkali-kali mengurangi kesalahan?
- Ketika suatu posisi dicakup oleh banyak pembacaan independen, kesalahan acak dalam pembacaan individual dapat diatasi oleh mayoritas, sehingga mengambil konsensus di seluruh pembacaan menghasilkan panggilan basa yang lebih akurat daripada pembacaan tunggal mana pun.