RNAシーケンス法と技術
RNAシーケンス(RNA-seq)は、RNAをシーケンスライブラリに変換し、遺伝子や転写産物にマッピングされるリードを計数することで、トランスクリプトームを測定する手法です。RNA-seqは、事前に定義されたプローブにハイブリダイズするのではなく、転写産物を直接サンプリングすることにより、広範なダイナミックレンジにわたる発現を定量化し、これまで注釈付けされていなかった転写産物やスプライスジャンクションを発見し、アイソフォーム構造を解明することができます。
Definition
RNAシーケンスは、RNAを逆転写(または直接シーケンス)し、得られたリードをマッピングおよび計数して、トランスクリプトーム全体の転写産物量を定量化し、転写産物構造を特徴づけるハイスループットシーケンスアプローチです。
Scope
このトピックでは、RNA-seqの実験的および計算的ワークフローについて扱います。具体的には、RNAの選択とライブラリ調製、ショートリードおよびロングリードシーケンスの化学、リードのアライメントまたは擬似アライメント、発現の定量化と正規化についてです。これはトランスクリプトミクスにおける方法論的なリファレンスであり、臨床的ガイダンスを提供するものではありません。
Core questions
- RNAサンプルはどのようにシーケンスライブラリに変換され、どのような選択ステップ(ポリA選択またはリボソーム除去)が測定対象を決定するのでしょうか?
- リードはどのようにリファレンスにアライメントまたは擬似アライメントされ、遺伝子または転写産物ごとに定量化されるのでしょうか?
- 発現をサンプル間で比較できるように、正規化はどのように行われるのでしょうか?
- ロングリードおよびダイレクトRNA技術は、ショートリードシーケンスに加えて何をもたらすのでしょうか?
Key concepts
- ライブラリ調製とポリA選択またはrRNA除去
- ショートリードとロングリードシーケンス
- リードのアライメントと擬似アライメント
- リードの計数と定量化
- 正規化(例:FPKM/TPMなどの単位)
- シーケンス深度とカバレッジ
- スプライスジャンクション検出
- ダイレクトRNAシーケンス
Mechanisms
典型的なワークフローでは、RNAが抽出され、その一部が選択され(一般的にはポリA鎖を持つメッセンジャーRNA、またはリボソームRNA除去後の全RNA)、断片化され、相補的DNAに逆転写され、アダプター結合ライブラリが構築されます。このライブラリはシーケンスされ、数百万のリードが生成されます。これらのリードは、リファレンスゲノムまたはトランスクリプトームにアライメントされるか、アライメントフリーの擬似アライメントによって定量化されます。各特徴と重なるリードが計数されます。長い転写産物や深くシーケンスされたサンプルほど多くのリードが蓄積されるため、発現量を比較する前に、リード数は転写産物の長さとライブラリサイズについて正規化されます。Mortazaviらは、基本的な計数と正規化のフレームワークを導入し、WangやOzsolakによるレビューでは、このプラットフォームの長所と限界が示されました。ロングリードおよびダイレクトRNA技術は、全長分子をシーケンスするため、リードあたりのエラー率が高く、スループットが低いという代償を伴いますが、アイソフォームの解像度を向上させます。
Clinical relevance
RNA-seqは、研究およびトランスレーショナルゲノミクスにおける分子分類およびバイオマーカー発見の証拠の多くを生み出し、診断における転写産物および融合遺伝子の検出をますますサポートしています。このリファレンストピックは、トランスクリプトームの証拠がどのように生成されるかを説明するものであり、個々の診断や治療の決定の根拠となるものではありません。
Evidence & guidelines
RNA-seqのベストプラクティスフレームワークは、Mortazaviらによる基礎的な定量化研究と、方法論レビュー(Wangら、OzsolakとMilos)に由来します。ロングリード解析には、Amarasingheらによって調査された独自の考慮事項が加わります。これらは臨床診療ガイドラインではなく、方法論的なリファレンスです。
History
RNA-seqは、ハイスループットショートリードシーケンスが逆転写RNAに適用された2008年に登場し、Mortazaviらがリードカウントから哺乳類のトランスクリプトームをマッピングおよび定量化する方法を確立しました。その後の数年間のレビューにより、ライブラリ調製と解析の標準が統合され、2010年代半ばからは、ロングリードおよびダイレクトRNAプラットフォームが、全長アイソフォームシーケンスに向けてこのアプローチを拡張しました。
Debates
- ショートリードとロングリードシーケンス
- ショートリードは高いスループットと低い塩基あたりのエラー率を提供しますが、アイソフォームを間接的にしか再構築できません。一方、ロングリードは全長転写産物をシーケンスし、アイソフォームを直接解明しますが、エラー率が高く、深度が低いという代償を伴います。適切な選択は、正確な定量化とアイソフォーム構造のどちらが優先されるかによって異なります。
Key figures
- Barbara Wold
- Ali Mortazavi
- Michael Snyder
Related topics
Seminal works
- mortazavi-2008
- wang-2009
- ozsolak-2011
Frequently asked questions
- ポリA選択とリボソームRNA除去の違いは何ですか?
- ポリA選択はポリA鎖を持つメッセンジャーRNAを捕捉し、タンパク質をコードする転写産物に効率的です。一方、リボソームRNA除去は豊富なrRNAを除去しつつ、ポリA鎖を持たない転写産物や分解された転写産物を保持します。どちらを選択するかによって、実験で測定できるRNA種が決まります。
- RNA-seqのカウントは比較する前に正規化されるのはなぜですか?
- 生のリードカウントは転写産物の長さと各サンプルがどれだけ深くシーケンスされたかに依存するため、直接比較することはできません。正規化はこれらの要因を調整し、発現量の違いが技術的な深度や長さではなく、生物学的なものに起因するようにします。
Methods for this concept
- RNA-seq Differential Expression
- Single-cell RNA-seq analysis
- De Novo Transcriptome Assembly
- Bayesian RNA-seq differential expression
- Time-series single-cell RNA-seq analysis
- Differential single-cell RNA-seq analysis
- Single-cell RNA-seq differential expression
- Machine learning-assisted RNA-seq differential expression