Методы и технологии секвенирования РНК
Секвенирование РНК (RNA-seq) измеряет транскриптом путем преобразования РНК в библиотеку для секвенирования и подсчета полученных прочтений, которые картируются обратно к генам и транскриптам. Путем прямого отбора транскриптов, а не их гибридизации с предопределенными зондами, RNA-seq может количественно определять экспрессию в широком динамическом диапазоне, обнаруживать ранее неаннотированные транскрипты и сайты сплайсинга, а также разрешать изоформную структуру.
Definition
Секвенирование РНК — это высокопроизводительный подход к секвенированию, при котором РНК подвергается обратной транскрипции (или прямому секвенированию), а полученные прочтения картируются и подсчитываются для количественной оценки обилия транскриптов и характеристики их структуры в транскриптоме.
Scope
Эта тема охватывает экспериментальный и вычислительный рабочий процесс RNA-seq: отбор РНК и подготовку библиотеки, химию секвенирования коротких и длинных прочтений, выравнивание или псевдовыравнивание прочтений, а также количественную оценку и нормализацию экспрессии. Это методологический справочник в области транскриптомики и не содержит клинических рекомендаций.
Core questions
- Как образец РНК превращается в библиотеку для секвенирования, и какие этапы отбора (поли-А или истощение рибосомной РНК) определяют, что измеряется?
- Как прочтения выравниваются или псевдовыравниваются по референсу, и как они количественно оцениваются для каждого гена или транскрипта?
- Как выполняется нормализация, чтобы экспрессию можно было сравнивать между образцами?
- Что добавляют технологии длинных прочтений и прямого секвенирования РНК по сравнению с секвенированием коротких прочтений?
Key concepts
- Подготовка библиотеки и отбор поли-А или истощение рРНК
- Секвенирование коротких прочтений против секвенирования длинных прочтений
- Выравнивание и псевдовыравнивание прочтений
- Подсчет и количественная оценка прочтений
- Нормализация (например, единицы, такие как FPKM/TPM)
- Глубина и покрытие секвенирования
- Обнаружение сайтов сплайсинга
- Прямое секвенирование РНК
Mechanisms
В типичном рабочем процессе РНК экстрагируется, и ее подмножество отбирается (обычно полиаденилированная матричная РНК или общая РНК после истощения рибосомной РНК), фрагментируется, подвергается обратной транскрипции в комплементарную ДНК и собирается в библиотеку, лигированную адаптерами. Библиотека секвенируется для получения миллионов прочтений, которые выравниваются по референсному геному или транскриптому, или количественно оцениваются путем псевдовыравнивания без выравнивания. Прочтения, перекрывающиеся с каждым признаком, подсчитываются; поскольку более длинные транскрипты и более глубоко секвенированные образцы накапливают больше прочтений, подсчеты нормализуются по длине транскрипта и размеру библиотеки до сравнения обилия. Мортазави и коллеги представили основную структуру подсчета и нормализации, а обзоры Вана и Озолака изложили сильные стороны и ограничения платформы. Технологии длинных прочтений и прямого секвенирования РНК секвенируют полноразмерные молекулы, улучшая разрешение изоформ за счет более высокой частоты ошибок на прочтение и более низкой пропускной способности.
Clinical relevance
RNA-seq генерирует большую часть доказательств молекулярной классификации и открытия биомаркеров в исследованиях и трансляционной геномике, а также все чаще поддерживает диагностическое обнаружение транскриптов и слияний. В качестве справочной темы она объясняет, как формируются транскриптомные данные; она не является основой для индивидуальных диагностических или лечебных решений.
Evidence & guidelines
Рамки передовой практики для RNA-seq основаны на фундаментальной работе по количественной оценке Мортазави и коллег, а также на обзорах методов (Ван и коллеги; Озолак и Милос). Анализ длинных прочтений добавляет свои собственные соображения, рассмотренные Амарасингхе и коллегами. Это методологические ссылки, а не клинические рекомендации.
History
RNA-seq появилась в 2008 году, когда высокопроизводительное секвенирование коротких прочтений было применено к обратно транскрибированной РНК, при этом Мортазави и коллеги установили, как картировать и количественно оценивать транскриптомы млекопитающих по подсчетам прочтений. Обзоры в последующие годы закрепили стандарты подготовки библиотек и анализа, а с середины 2010-х годов платформы длинных прочтений и прямого секвенирования РНК расширили подход к секвенированию полноразмерных изоформ.
Debates
- Секвенирование коротких прочтений против секвенирования длинных прочтений
- Короткие прочтения обеспечивают высокую пропускную способность и низкую частоту ошибок на нуклеотид, но реконструируют изоформы только косвенно, тогда как длинные прочтения секвенируют полноразмерные транскрипты и напрямую разрешают изоформы за счет более высоких показателей ошибок и меньшей глубины; соответствующий выбор зависит от того, является ли приоритетом точная количественная оценка или структура изоформ.
Key figures
- Barbara Wold
- Ali Mortazavi
- Michael Snyder
Related topics
Seminal works
- mortazavi-2008
- wang-2009
- ozsolak-2011
Frequently asked questions
- В чем разница между отбором поли-А и истощением рибосомной РНК?
- Отбор поли-А захватывает полиаденилированную матричную РНК и эффективен для кодирующих белок транскриптов, тогда как истощение рибосомной РНК удаляет обильную рРНК, сохраняя при этом неполиаденилированные и деградированные транскрипты. Выбор определяет, какие виды РНК может измерять эксперимент.
- Почему подсчеты RNA-seq нормализуются перед сравнением?
- Исходные подсчеты прочтений зависят от длины транскрипта и от того, насколько глубоко был секвенирован каждый образец, поэтому их нельзя сравнивать напрямую. Нормализация корректирует эти факторы, чтобы различия в обилии отражали биологию, а не техническую глубину или длину.
Methods for this concept
- RNA-seq Differential Expression
- Single-cell RNA-seq analysis
- De Novo Transcriptome Assembly
- Bayesian RNA-seq differential expression
- Time-series single-cell RNA-seq analysis
- Differential single-cell RNA-seq analysis
- Single-cell RNA-seq differential expression
- Machine learning-assisted RNA-seq differential expression