RNAシーケンシングとトランスクリプトミクス
RNAシーケンシング(RNA-seq)は、ハイスループットシーケンシングによってサンプル中のRNA分子の同定と存在量を決定し、遺伝子発現の定量的かつゲノムワイドな全体像を提供します。トランスクリプトミクスは、この完全な転写産物セットであるトランスクリプトームと、それが組織、条件、疾患状態間でどのように変化するかを研究する学問分野です。
Definition
RNAシーケンシングは、RNAをシーケンスされた断片のライブラリに変換し、遺伝子または転写産物にマッピングされたリードをカウントすることによって、細胞または組織に存在するRNA分子の完全なセットであるトランスクリプトーム全体の発現を定量化する方法です。
Scope
このトピックでは、RNA-seqがシーケンスリードを発現量推定値に変換する方法、動的な読み出しとしてのトランスクリプトームの意味、一般的な定量単位、およびシーケンスベースの測定に特有の品質と標準化の問題について説明します。これは、RNA-seqを臨床検査プロトコルとしてではなく、測定および発見プラットフォームとして扱います。
Core questions
- シーケンスリードはどのようにして定量的な発現推定値に変換されますか?
- トランスクリプトームは、固定された遺伝子リストを超えて何を捉えますか?
- 正規化とリード深度は比較可能性にどのように影響しますか?
- RNA-seqの精度と再現性はどのように評価されますか?
Key concepts
- トランスクリプトーム
- リードマッピングとカウント
- 正規化(例:深度および長さスケーリング)
- 差次的発現
- スパイクインコントロール
- シングルセルおよびバルクトランスクリプトミクス
Mechanisms
RNAは抽出され、cDNAに逆転写され、断片化され、シーケンシングライブラリに調製されます。得られたリードは参照ゲノムまたはトランスクリプトームにアラインされ、各特徴と重複するリードの数は、その発現に比例するカウントを提供します(Mortazavi et al., 2008)。総リード深度と転写産物長は生カウントに影響するため、転写産物を比較する前にデータは正規化され、存在量はしばしば長さおよび深度でスケーリングされた単位で表されます。RNA-seqは、新規転写産物、スプライスバリアント、および広範なダイナミックレンジの発現を検出でき、以前のハイブリダイゼーションベースのプロファイリングとは区別されます(Wang et al., 2009)。外部スパイクイン標準とコンソーシアムベンチマーキングは、プラットフォームの精度と限界を特徴付けるために使用されます(Jiang et al., 2011; SEQC/MAQC-III Consortium, 2014)。
Clinical relevance
RNA-seqは、分子腫瘍プロファイリング、融合検出、および発現ベースの分類の基盤となることが増えており、そのようなデータを解釈するには、カウントがどのように発現推定値になるかを理解する必要があります。この項目では、この方法とその定量的特性について説明します。検証済みの分析法と臨床基準に基づく診断的解釈や治療ガイダンスは提供しません。
Evidence & guidelines
RNA-seqを定量的手法として記述した基礎的な論文(Mortazavi et al., 2008; Wang et al., 2009)は、外部スパイクイン標準(Jiang et al., 2011)やRNA-seq性能のSEQC/MAQC-IIIベンチマーキング(2014)を含む、精度と再現性に関するコミュニティの取り組みによって補完されています。
History
トランスクリプトーム測定は、2000年代後半に次世代シーケンシングによって全トランスクリプトームのリードカウントが実用的になったことで、発現配列タグやマイクロアレイのアプローチから直接シーケンシングへと移行しました(Mortazavi et al., 2008)。RNA-seqはすぐに発現研究の標準となり、その後のコンソーシアムの作業では、その測定値を比較可能かつ再現可能にする方法が検討されました(SEQC/MAQC-III Consortium, 2014)。
Debates
- RNA-seqのカウントは比較のためにどのように正規化されるべきですか?
- 生カウントはシーケンス深度と転写産物長に依存し、異なる正規化の選択は、差次的に発現しているように見える遺伝子を変える可能性があります。適切な正規化とコントロールの選択は、依然として方法論的な懸念事項です。
Key figures
- Zhong Wang
- Michael Snyder
- Ali Mortazavi
- Barbara Wold
Related topics
Seminal works
- wang-2009
- mortazavi-2008
- seqc-2014
Frequently asked questions
- トランスクリプトームとは何ですか?
- トランスクリプトームとは、特定の時点である細胞または組織に存在するRNA転写産物の完全なセットです。条件や細胞の種類によって変化するため、それを測定することで、どの遺伝子がどのレベルで活性化しているかを示すことができます。
- RNA-seqは発現解析においてマイクロアレイとどう異なりますか?
- RNA-seqはRNAを直接シーケンスしてカウントするため、新規転写産物やスプライスバリアントを検出でき、広範なダイナミックレンジをカバーします。一方、マイクロアレイは事前に定義されたプローブへのハイブリダイゼーションを測定するため、既知の配列に限定されます。
Methods for this concept
- RNA-seq Differential Expression
- Single-cell RNA-seq analysis
- Bayesian RNA-seq differential expression
- Time-series single-cell RNA-seq analysis
- De Novo Transcriptome Assembly
- Differential single-cell RNA-seq analysis
- Multi-omics RNA-seq differential expression
- Machine learning-assisted RNA-seq differential expression