РНК-секвенирование и транскриптомика
РНК-секвенирование (RNA-seq) определяет идентичность и количество молекул РНК в образце с помощью высокопроизводительного секвенирования, предоставляя количественную, общегеномную картину экспрессии генов. Транскриптомика — это исследование полного набора этих транскриптов, или транскриптома, и того, как он изменяется между тканями, состояниями и заболеваниями.
Definition
РНК-секвенирование — это метод, который преобразует РНК в библиотеку секвенированных фрагментов и подсчитывает прочтения, картированные на гены или транскрипты, для количественной оценки экспрессии по всему транскриптому — полному набору молекул РНК, присутствующих в клетке или ткани.
Scope
Эта тема охватывает, как RNA-seq преобразует данные секвенирования в оценки экспрессии, значение транскриптома как динамического показателя, общие единицы количественной оценки, а также проблемы качества и стандартизации, специфичные для измерений на основе секвенирования. Она рассматривает RNA-seq как платформу для измерения и открытия, а не как протокол клинического тестирования.
Core questions
- Как данные секвенирования преобразуются в количественные оценки экспрессии?
- Что транскриптом охватывает помимо фиксированного списка генов?
- Как нормализация и глубина прочтения влияют на сопоставимость?
- Как оценивается точность и воспроизводимость RNA-seq?
Key concepts
- Транскриптом
- Картирование и подсчет прочтений
- Нормализация (например, масштабирование по глубине и длине)
- Дифференциальная экспрессия
- Контроли-спайки
- Одноклеточная и объемная транскриптомика
Mechanisms
РНК экстрагируется, обратно транскрибируется в кДНК, фрагментируется и подготавливается в библиотеку для секвенирования; полученные прочтения выравниваются по референсному геному или транскриптому, и количество прочтений, перекрывающихся с каждым элементом, дает счет, пропорциональный его экспрессии (Mortazavi et al., 2008). Поскольку общая глубина прочтения и длина транскрипта влияют на необработанные счетчики, данные нормализуются перед сравнением транскриптов, и количество часто выражается в единицах, масштабированных по длине и глубине. RNA-seq может обнаруживать новые транскрипты, варианты сплайсинга и широкий динамический диапазон экспрессии, что отличает его от более ранних методов профилирования на основе гибридизации (Wang et al., 2009). Внешние стандарты-спайки и консорциумное бенчмаркинг используются для характеристики точности и пределов платформы (Jiang et al., 2011; SEQC/MAQC-III Consortium, 2014).
Clinical relevance
RNA-seq все чаще лежит в основе молекулярного профилирования опухолей, обнаружения слияний и классификации на основе экспрессии, и интерпретация таких данных требует понимания того, как счетчики становятся оценками экспрессии. Эта статья описывает метод и его количественные свойства; она не предоставляет диагностических интерпретаций или рекомендаций по лечению, которые основываются на валидированных анализах и клинических критериях.
Evidence & guidelines
Основополагающие описания RNA-seq как количественного метода (Mortazavi et et al., 2008; Wang et al., 2009) дополняются усилиями сообщества по обеспечению точности и воспроизводимости, включая внешние стандарты-спайки (Jiang et al., 2011) и бенчмаркинг производительности RNA-seq консорциумом SEQC/MAQC-III (2014).
History
Измерение транскриптома перешло от подходов с использованием экспрессированных последовательностей (expressed-sequence-tag) и микрочипов к прямому секвенированию в конце 2000-х годов, когда секвенирование нового поколения сделало подсчет прочтений всего транскриптома практичным (Mortazavi et al., 2008). RNA-seq быстро стал стандартом для исследований экспрессии, и последующая работа консорциума была направлена на то, как сделать его измерения сопоставимыми и воспроизводимыми (SEQC/MAQC-III Consortium, 2014).
Debates
- Как следует нормализовать данные RNA-seq для сравнения?
- Необработанные счетчики зависят от глубины секвенирования и длины транскрипта, и различные варианты нормализации могут изменить то, какие гены кажутся дифференциально экспрессированными; выбор соответствующей нормализации и контролей остается методологической проблемой.
Key figures
- Zhong Wang
- Michael Snyder
- Ali Mortazavi
- Barbara Wold
Related topics
Seminal works
- wang-2009
- mortazavi-2008
- seqc-2014
Frequently asked questions
- Что такое транскриптом?
- Транскриптом — это полный набор транскриптов РНК, присутствующих в клетке или ткани в данный момент времени; поскольку он меняется в зависимости от состояния и типа клетки, его измерение показывает, какие гены активны и на каком уровне.
- Чем RNA-seq отличается от микрочипов для анализа экспрессии?
- RNA-seq напрямую секвенирует и подсчитывает РНК, поэтому он может обнаруживать новые транскрипты и варианты сплайсинга и охватывает широкий динамический диапазон, тогда как микрочипы измеряют гибридизацию с предопределенными зондами и ограничены известными последовательностями.
Methods for this concept
- RNA-seq Differential Expression
- Single-cell RNA-seq analysis
- Bayesian RNA-seq differential expression
- Time-series single-cell RNA-seq analysis
- De Novo Transcriptome Assembly
- Differential single-cell RNA-seq analysis
- Multi-omics RNA-seq differential expression
- Machine learning-assisted RNA-seq differential expression