Вариации числа копий: обнаружение и классификация
Вариация числа копий (ВЧК) — это сегмент ДНК, который присутствует в различном количестве копий у разных индивидуумов — приобретенный путем дупликации или утраченный путем делеции относительно референсного генома. ВЧК являются основным компонентом структурных вариаций, и центральные методологические вопросы заключаются в том, как надежно обнаружить их по данным микрочипов или секвенирования и как классифицировать их по размеру, состоянию копий и вероятной значимости.
Definition
Вариация числа копий — это сегмент ДНК, обычно размером один килобаз или более, который отличается по числу присутствующих копий по сравнению с референсным геномом, возникающий как делеция (потеря копии) или дупликация, или амплификация более высокого порядка (увеличение числа копий).
Scope
Эта тема охватывает определение ВЧК, основные технологии, используемые для их обнаружения и определения размера (сравнительная геномная гибридизация на микрочипах, SNP-матрицы, а также сигналы глубины прочтения или парных концов из данных секвенирования), и основы, на которых они классифицируются — усиление против потери, число копий, рекуррентность и частота. Это справочное описание концепций обнаружения и классификации, которое не предоставляет диагностическую интерпретацию для отдельных лиц.
Core questions
- Что отличает вариацию числа копий от других структурных вариантов?
- Какие сигналы — интенсивность гибридизации, глубина прочтения, данные парных концов и разделенных прочтений — используются для выявления ВЧК?
- Как классифицируются ВЧК по состоянию копий, размеру, рекуррентности и популяционной частоте?
- Каковы пределы разрешения и источники ложных вызовов для каждой платформы обнаружения?
Key concepts
- Увеличение числа копий (дупликация) и потеря числа копий (делеция)
- Сравнительная геномная гибридизация на микрочипах (aCGH)
- Логарифмическое отношение R и частота B-аллелей в SNP-матрицах
- Обнаружение по глубине прочтения и парным концам
- Разрешение точек разрыва
- Рекуррентные и нерекуррентные ВЧК
- Популяционная частота и классификация на доброкачественные и патогенные
Mechanisms
Обнаружение ВЧК преобразует физическое изменение дозировки ДНК в измеряемый сигнал. Сравнительная геномная гибридизация на микрочипах и SNP-матрицы считывают относительную интенсивность гибридизации, поэтому делеция снижает, а дупликация повышает сигнал по всему затронутому интервалу; SNP-матрицы добавляют информацию о соотношении аллелей, что помогает различать состояния копий. Подходы, основанные на секвенировании, выводят число копий из глубины прочтения — больше прочтений накапливается над дуплицированными областями и меньше над делециями — и используют дискордантные парные концы и выравнивания разделенных прочтений для локализации точек разрыва. Классификация затем объединяет состояние копий, размер, рекуррентность варианта в архитектурно-определенных точках разрыва и его частоту в референсных популяциях.
Clinical relevance
Анализ числа копий широко используется в науках о здоровье для характеристики геномных усилений и потерь, и различение общих доброкачественных ВЧК от редких событий, изменяющих дозировку, является центральным для интерпретации геномных данных. Эта статья описывает, как ВЧК обнаруживаются и категоризируются с методологической точки зрения; она не является основанием для индивидуальной диагностики или лечения.
Epidemiology
Ранние полногеномные исследования установили, что ВЧК распространены у здоровых людей: Себат и коллеги впервые показали широкое распространение полиморфизма числа копий, а Редон и коллеги картировали глобальные ВЧК в популяциях HapMap. Последующие каталоги, основанные на секвенировании, включая карту структурных вариаций проекта «1000 геномов», уточнили частоты и показали, что делеции и дупликации в совокупности охватывают значительную часть вариабельного генома.
History
Признание того, что число копий широко варьируется среди здоровых людей, появилось в 2004 году в результате исследований на микрочипах, проведенных Себатом и Иафрате с коллегами, что опровергло предположение о редкости таких вариаций. Полногеномные карты ВЧК с платформ микрочипов появились в 2006 году, а переход к высокопроизводительному секвенированию в следующем десятилетии привел к появлению методов, основанных на глубине прочтения и парных концах, которые улучшили разрешение точек разрыва и объединили выявление ВЧК с общим обнаружением структурных вариантов.
Debates
- Как следует согласовывать различия между платформами обнаружения?
- Массивы и методы, основанные на секвенировании, сообщают о перекрывающихся, но неидентичных наборах ВЧК, различающихся по разрешению размера, точности точек разрыва и чувствительности в повторяющихся регионах, поэтому гармонизация вызовов и частот между платформами остается признанной методологической проблемой.
Key figures
- Jonathan Sebat
- Stephen W. Scherer
- Charles Lee
- Evan E. Eichler
- Nigel P. Carter
Related topics
Seminal works
- sebat-2004
- redon-2006
- alkan-2011
Frequently asked questions
- В чем разница между ВЧК и делецией?
- Делеция — это один из видов вариаций числа копий (потеря копии). Термин ВЧК шире и также включает дупликации и усиления копий более высокого порядка, поэтому каждая делеция соответствующего размера является ВЧК, но не каждая ВЧК является делецией.
- Почему две платформы могут сообщать о разных ВЧК для одного и того же образца?
- Методы на основе микрочипов и секвенирования различаются по разрешению, точности точек разрыва и чувствительности в повторяющихся регионах, поэтому они выявляют перекрывающиеся, но не идентичные наборы вариантов и могут по-разному определять размер одного и того же события.
Methods for this concept
- Copy Number Variation Analysis
- Machine learning-assisted copy number variation analysis
- Bayesian Copy Number Variation Analysis
- Differential Copy Number Variation Analysis
- Single-cell Copy Number Variation Analysis
- Variant Calling
- Time-series copy number variation analysis
- Network-based copy number variation analysis