ScholarGate
Assistant

Méthodes et technologies de séquençage de l'ARN

Le séquençage de l'ARN (RNA-seq) mesure le transcriptome en convertissant l'ARN en une banque de séquençage et en quantifiant les lectures résultantes qui se mappent aux gènes et aux transcrits. En échantillonnant directement les transcrits plutôt qu'en les hybridant à des sondes prédéfinies, le RNA-seq peut quantifier l'expression sur une large gamme dynamique, découvrir des transcrits et des jonctions d'épissage (splice junctions) précédemment non annotés, et résoudre la structure des isoformes.

Trouver un sujet avec PaperMindBientôtFind papers & topics
Tools & resources
Télécharger les diapositives
Learn & explore
VidéoBientôt

Definition

Le séquençage de l'ARN est une approche de séquençage à haut débit dans laquelle l'ARN est rétro-transcrit (ou séquencé directement) et les lectures résultantes sont mappées et comptées pour quantifier l'abondance des transcrits et caractériser la structure des transcrits à travers le transcriptome.

Scope

Ce sujet couvre le flux de travail expérimental et computationnel du RNA-seq : la sélection de l'ARN et la préparation de la banque, les chimies de séquençage à lectures courtes et à lectures longues, l'alignement ou le pseudo-alignement des lectures, ainsi que la quantification et la normalisation de l'expression. Il s'agit d'une référence méthodologique en transcriptomique et ne fournit pas de conseils cliniques.

Core questions

  • Comment un échantillon d'ARN est-il transformé en une banque de séquençage, et quelles étapes de sélection (déplétion poly-A ou ribosomale) déterminent ce qui est mesuré ?
  • Comment les lectures sont-elles alignées ou pseudo-alignées à une référence, et quantifiées par gène ou transcrit ?
  • Comment la normalisation est-elle effectuée afin que l'expression puisse être comparée entre les échantillons ?
  • Qu'apportent les technologies à lectures longues et de séquençage direct de l'ARN par rapport au séquençage à lectures courtes ?

Key concepts

  • Préparation de la banque et sélection poly-A ou déplétion de l'ARNr
  • Séquençage à lectures courtes versus lectures longues
  • Alignement et pseudo-alignement des lectures
  • Comptage et quantification des lectures
  • Normalisation (par exemple, unités telles que FPKM/TPM)
  • Profondeur et couverture de séquençage
  • Détection des jonctions d'épissage (splice junctions)
  • Séquençage direct de l'ARN

Mechanisms

Dans un flux de travail typique, l'ARN est extrait et un sous-ensemble est sélectionné (généralement l'ARN messager polyadénylé, ou l'ARN total après déplétion de l'ARN ribosomal), fragmenté, rétro-transcrit en ADN complémentaire, et intégré dans une banque ligaturée à des adaptateurs. La banque est séquencée pour produire des millions de lectures, qui sont alignées sur un génome ou un transcriptome de référence, ou quantifiées par pseudo-alignement sans alignement. Les lectures chevauchant chaque caractéristique sont comptées ; étant donné que les transcrits plus longs et les échantillons séquencés plus profondément accumulent plus de lectures, les comptes sont normalisés en fonction de la longueur du transcrit et de la taille de la banque avant que l'abondance ne soit comparée. Mortazavi et ses collègues ont introduit le cadre fondamental de comptage et de normalisation, et des revues par Wang et par Ozsolak ont exposé les forces et les limites de la plateforme. Les technologies à lectures longues et de séquençage direct de l'ARN séquencent des molécules pleine longueur, améliorant la résolution des isoformes au prix d'une erreur par lecture plus élevée et d'un débit plus faible.

Clinical relevance

Le RNA-seq génère une grande partie des preuves de classification moléculaire et de découverte de biomarqueurs dans la recherche et la génomique translationnelle, et soutient de plus en plus la détection diagnostique de transcrits et de fusions. En tant que sujet de référence, il explique comment les preuves transcriptomiques sont produites ; il ne constitue pas une base pour des décisions diagnostiques ou thérapeutiques individuelles.

Evidence & guidelines

Les cadres de bonnes pratiques pour le RNA-seq dérivent des travaux de quantification fondamentaux de Mortazavi et de ses collègues et des revues de méthodes (Wang et ses collègues ; Ozsolak et Milos). L'analyse des lectures longues ajoute ses propres considérations, examinées par Amarasinghe et ses collègues. Ce sont des références méthodologiques plutôt que des lignes directrices de pratique clinique.

History

Le RNA-seq a émergé en 2008 lorsque le séquençage à haut débit à lectures courtes a été appliqué à l'ARN rétro-transcrit, Mortazavi et ses collègues ayant établi comment mapper et quantifier les transcriptomes mammaliens à partir des comptes de lectures. Les revues des années suivantes ont consolidé les normes de préparation de banques et d'analyse, et à partir du milieu des années 2010, les plateformes à lectures longues et de séquençage direct de l'ARN ont étendu l'approche vers le séquençage d'isoformes pleine longueur.

Debates

Séquençage à lectures courtes versus lectures longues
Les lectures courtes offrent un débit élevé et une faible erreur par base, mais ne reconstruisent les isoformes qu'indirectement, tandis que les lectures longues séquencent des transcrits pleine longueur et résolvent directement les isoformes au prix de taux d'erreur plus élevés et d'une profondeur plus faible ; le choix approprié dépend de la priorité donnée à la quantification précise ou à la structure des isoformes.

Key figures

  • Barbara Wold
  • Ali Mortazavi
  • Michael Snyder

Related topics

Seminal works

  • mortazavi-2008
  • wang-2009
  • ozsolak-2011

Frequently asked questions

Quelle est la différence entre la sélection poly-A et la déplétion de l'ARN ribosomal ?
La sélection poly-A capture l'ARN messager polyadénylé et est efficace pour les transcrits codant des protéines, tandis que la déplétion de l'ARN ribosomal élimine l'ARNr abondant tout en retenant les transcrits non polyadénylés et dégradés. Le choix détermine quelles espèces d'ARN l'expérience peut mesurer.
Pourquoi les comptes de RNA-seq sont-ils normalisés avant comparaison ?
Les comptes de lectures bruts dépendent de la longueur du transcrit et de la profondeur de séquençage de chaque échantillon, ils ne peuvent donc pas être comparés directement. La normalisation ajuste ces facteurs afin que les différences d'abondance reflètent la biologie plutôt que la profondeur technique ou la longueur.

Methods for this concept

Related concepts