Контроль качества и коррекция ошибок в секвенировании
Каждый запуск секвенирования производит вызовы оснований с различной степенью надежности, поэтому контроль качества и коррекция ошибок — это этапы, которые количественно оценивают точность каждого основания, фильтруют или обрезают низкокачественные данные и корректируют систематические артефакты до того, как риды будут собраны или использованы для вызова вариантов. Без них последующие геномные выводы могут быть искажены техническим шумом, а не биологией.
Definition
Контроль качества в секвенировании — это оценка и улучшение надежности ридов с использованием показателей качества каждого основания, обрезки и фильтрации, а также методов коррекции ошибок для удаления или исправления технических артефактов, чтобы сборка и вызов вариантов отражали основную последовательность, а не ошибку измерения.
Scope
Статья охватывает оценку качества каждого основания (Phred), виды ошибок и смещений, влияющих на риды секвенирования, обрезку и фильтрацию ридов, а также роль избыточного покрытия в различении истинного сигнала от ошибки. Это методологическая тема о надежности данных, которая не предоставляет клинических или лабораторных протоколов.
Core questions
- Как количественно оценивается надежность отдельного вызова основания?
- Какие виды ошибок и смещений влияют на риды секвенирования?
- Как обрезка, фильтрация и избыточное покрытие уменьшают влияние ошибок?
Key concepts
- Оценка качества Phred
- Точность вызова основания
- Обрезка и фильтрация ридов
- Профили ошибок секвенирования
- Покрытие и консенсусное снижение ошибок
- Обрезка адаптеров и качества
- Контроль ложноположительных вариантов
Mechanisms
Платформы секвенирования присваивают каждому вызову основания оценку качества Phred — логарифмическую оценку вероятности того, что вызов неверен, что позволяет помечать основания с низкой достоверностью. Инструменты контроля качества затем обрезают адаптеры и низкокачественные концы и фильтруют ненадежные риды перед анализом. Поскольку ошибки частично случайны и частично систематичны, многократное секвенирование каждой позиции позволяет получить консенсус, так что изолированные ошибки перевешиваются, в то время как характеристика профилей ошибок помогает отличить повторяющиеся артефакты от подлинных низкочастотных вариантов. Эти шаги уменьшают количество ложноположительных результатов при последующем вызове вариантов и улучшают точность сборки.
Clinical relevance
Контроль качества и коррекция ошибок определяют, отражают ли геномные находки истинную последовательность или технический шум, что критически важно везде, где секвенирование используется для исследований или клинической интерпретации. Эта статья является образовательным справочным материалом по надежности данных и не является руководством для какого-либо конкретного теста или клинического решения.
Evidence & guidelines
Методы документированы в первичных статьях об инструментах и анализе, а не в клинических рекомендациях: Ewing et al. (1998) установили оценку качества каждого основания Phred, Bolger et al. (2014) — широко используемый инструмент для обрезки ридов, а Ma et al. (2019) характеризует профили ошибок в данных глубокого секвенирования; обзоры, такие как Sims et al. (2014), связывают покрытие с контролем ошибок.
History
Оценка качества каждого основания была формализована с помощью программы Phred в 1998 году, предоставив данным секвенирования стандартизированную, интерпретируемую меру достоверности вызова основания, которая стала универсальной. По мере того как высокопроизводительные платформы производили огромные объемы ридов, в 2010-х годах появились специализированные инструменты для обрезки и фильтрации, а подробные анализы профилей ошибок уточнили, как подлинные низкочастотные варианты отделяются от систематических артефактов секвенирования.
Key figures
- Phil Green
- Brent Ewing
- Björn Usadel
Related topics
Seminal works
- ewing-1998
- bolger-2014
- ma-2019
Frequently asked questions
- Что такое оценка качества Phred?
- Это логарифмическая мера оценочной вероятности того, что вызов основания неверен; например, оценка Phred 30 соответствует примерно 1 шансу из 1000 на ошибку, поэтому более высокие оценки указывают на более надежные вызовы оснований.
- Как секвенирование одной и той же позиции много раз уменьшает количество ошибок?
- Когда позиция покрывается множеством независимых ридов, случайные ошибки в отдельных ридах могут быть перевешены большинством, поэтому получение консенсуса по всем ридам дает более точный вызов основания, чем любой отдельный рид.