Métodos e Tecnologias de Sequenciamento de RNA
O sequenciamento de RNA (RNA-seq) mede o transcriptoma convertendo o RNA em uma biblioteca de sequenciamento e contando as leituras resultantes que mapeiam de volta para genes e transcritos. Ao amostrar transcritos diretamente, em vez de hibridizá-los a sondas predefinidas, o RNA-seq pode quantificar a expressão em uma ampla faixa dinâmica, descobrir transcritos e junções de splicing previamente não anotados e resolver a estrutura das isoformas.
Definition
O sequenciamento de RNA é uma abordagem de sequenciamento de alto rendimento na qual o RNA é transcrito reversamente (ou sequenciado diretamente) e as leituras resultantes são mapeadas e contadas para quantificar a abundância de transcritos e caracterizar a estrutura dos transcritos em todo o transcriptoma.
Scope
Este tópico abrange o fluxo de trabalho experimental e computacional do RNA-seq: seleção de RNA e preparação de biblioteca, químicas de sequenciamento de leitura curta e leitura longa, alinhamento ou pseudo-alinhamento de leituras, e quantificação e normalização da expressão. É uma referência metodológica dentro da transcriptômica e não fornece orientação clínica.
Core questions
- Como uma amostra de RNA é transformada em uma biblioteca de sequenciamento, e quais etapas de seleção (poli-A ou depleção ribossômica) moldam o que é medido?
- Como as leituras são alinhadas ou pseudo-alinhadas a uma referência, e quantificadas por gene ou transcrito?
- Como a normalização é realizada para que a expressão possa ser comparada entre as amostras?
- O que as tecnologias de leitura longa e RNA direto adicionam em relação ao sequenciamento de leitura curta?
Key concepts
- Preparação de biblioteca e seleção poli-A ou depleção de rRNA
- Sequenciamento de leitura curta versus leitura longa
- Alinhamento e pseudo-alinhamento de leituras
- Contagem e quantificação de leituras
- Normalização (por exemplo, unidades como FPKM/TPM)
- Profundidade e cobertura de sequenciamento
- Detecção de junção de splicing
- Sequenciamento direto de RNA
Mechanisms
Em um fluxo de trabalho típico, o RNA é extraído e um subconjunto é selecionado (comumente RNA mensageiro poliadenilado, ou RNA total após depleção de RNA ribossômico), fragmentado, transcrito reversamente em DNA complementar e construído em uma biblioteca ligada a adaptadores. A biblioteca é sequenciada para produzir milhões de leituras, que são alinhadas a um genoma ou transcriptoma de referência, ou quantificadas por pseudo-alinhamento sem alinhamento. As leituras que se sobrepõem a cada característica são contadas; como transcritos mais longos e amostras sequenciadas mais profundamente acumulam mais leituras, as contagens são normalizadas para o comprimento do transcrito e o tamanho da biblioteca antes que a abundância seja comparada. Mortazavi e colegas introduziram a estrutura central de contagem e normalização, e revisões de Wang e Ozsolak apresentaram os pontos fortes e limitações da plataforma. As tecnologias de leitura longa e RNA direto sequenciam moléculas de comprimento total, melhorando a resolução de isoformas ao custo de um erro por leitura mais alto e menor rendimento.
Clinical relevance
O RNA-seq gera grande parte da evidência de classificação molecular e descoberta de biomarcadores em pesquisa e genômica translacional, e apoia cada vez mais a detecção diagnóstica de transcritos e fusões. Como um tópico de referência, ele explica como a evidência transcriptômica é produzida; não é uma base para decisões individuais de diagnóstico ou tratamento.
Evidence & guidelines
As estruturas de melhores práticas para RNA-seq derivam do trabalho fundamental de quantificação de Mortazavi e colegas e de revisões de métodos (Wang e colegas; Ozsolak e Milos). A análise de leitura longa adiciona suas próprias considerações, pesquisadas por Amarasinghe e colegas. Estas são referências metodológicas, e não diretrizes de prática clínica.
History
O RNA-seq surgiu em 2008, quando o sequenciamento de leitura curta de alto rendimento foi aplicado ao RNA transcrito reversamente, com Mortazavi e colegas estabelecendo como mapear e quantificar transcriptomas de mamíferos a partir de contagens de leitura. Revisões nos anos seguintes consolidaram os padrões de preparação e análise de bibliotecas, e a partir de meados dos anos 2010, as plataformas de leitura longa e RNA direto estenderam a abordagem para o sequenciamento de isoformas de comprimento total.
Debates
- Sequenciamento de leitura curta versus leitura longa
- As leituras curtas oferecem alto rendimento e baixo erro por base, mas reconstroem isoformas apenas indiretamente, enquanto as leituras longas sequenciam transcritos de comprimento total e resolvem isoformas diretamente ao custo de taxas de erro mais altas e menor profundidade; a escolha apropriada depende se a quantificação precisa ou a estrutura da isoforma é a prioridade.
Key figures
- Barbara Wold
- Ali Mortazavi
- Michael Snyder
Related topics
Seminal works
- mortazavi-2008
- wang-2009
- ozsolak-2011
Frequently asked questions
- Qual a diferença entre a seleção poli-A e a depleção de RNA ribossômico?
- A seleção poli-A captura o RNA mensageiro poliadenilado e é eficiente para transcritos codificadores de proteínas, enquanto a depleção de RNA ribossômico remove o rRNA abundante, retendo transcritos não poliadenilados e degradados. A escolha determina quais espécies de RNA o experimento pode medir.
- Por que as contagens de RNA-seq são normalizadas antes da comparação?
- As contagens de leitura brutas dependem do comprimento do transcrito e da profundidade com que cada amostra foi sequenciada, portanto, não podem ser comparadas diretamente. A normalização ajusta esses fatores para que as diferenças na abundância reflitam a biologia, e não a profundidade técnica ou o comprimento.
Methods for this concept
- RNA-seq Differential Expression
- Single-cell RNA-seq analysis
- De Novo Transcriptome Assembly
- Bayesian RNA-seq differential expression
- Time-series single-cell RNA-seq analysis
- Differential single-cell RNA-seq analysis
- Single-cell RNA-seq differential expression
- Machine learning-assisted RNA-seq differential expression