RNA 시퀀싱 및 전사체학
RNA 시퀀싱(RNA-seq)은 고처리량 시퀀싱을 통해 샘플 내 RNA 분자의 정체와 풍부도를 결정하여 유전자 발현에 대한 정량적이고 게놈 전체적인 그림을 제공합니다. 전사체학은 이러한 완전한 전사체 세트인 전사체(transcriptome)와 이것이 조직, 조건 및 질병 상태에 따라 어떻게 변화하는지를 연구하는 학문입니다.
Definition
RNA 시퀀싱은 RNA를 시퀀싱된 단편 라이브러리로 변환하고, 유전자 또는 전사체에 매핑된 판독값을 계산하여 세포나 조직에 존재하는 완전한 RNA 분자 세트인 전사체 전반의 발현량을 정량화하는 방법입니다.
Scope
이 주제는 RNA-seq가 시퀀스 판독값을 발현량 추정치로 변환하는 방법, 동적인 판독값으로서의 전사체의 의미, 일반적인 정량화 단위, 그리고 시퀀싱 기반 측정에 특정한 품질 및 표준화 문제를 다룹니다. 이는 RNA-seq를 임상 테스트 프로토콜이 아닌 측정 및 발견 플랫폼으로 취급합니다.
Core questions
- 시퀀싱 판독값은 어떻게 정량적 발현량 추정치로 변환됩니까?
- 전사체는 고정된 유전자 목록 외에 무엇을 포착합니까?
- 정규화 및 판독 깊이는 비교 가능성에 어떻게 영향을 미칩니까?
- RNA-seq의 정확성과 재현성은 어떻게 평가됩니까?
Key concepts
- 전사체
- 판독값 매핑 및 계수
- 정규화(예: 깊이 및 길이 스케일링)
- 차등 발현
- 스파이크인 대조군
- 단일 세포 및 벌크 전사체학
Mechanisms
RNA는 추출되어 cDNA로 역전사되고, 단편화된 후 시퀀싱 라이브러리로 준비됩니다. 결과로 얻은 판독값은 참조 게놈 또는 전사체에 정렬되며, 각 특징(feature)과 겹치는 판독값의 수는 해당 특징의 발현량에 비례하는 수를 제공합니다(Mortazavi et al., 2008). 총 판독 깊이(read depth)와 전사체 길이(transcript length)가 원시 계수(raw counts)에 영향을 미치므로, 전사체를 비교하기 전에 데이터는 정규화되며, 풍부도(abundance)는 종종 길이 및 깊이 스케일링된 단위로 표현됩니다. RNA-seq는 새로운 전사체, 스플라이스 변이체 및 넓은 동적 범위의 발현을 감지할 수 있어 이전의 하이브리드화 기반 프로파일링과 구별됩니다(Wang et al., 2009). 외부 스파이크인 표준(spike-in standards) 및 컨소시엄 벤치마킹은 플랫폼의 정확성과 한계를 특성화하는 데 사용됩니다(Jiang et al., 2011; SEQC/MAQC-III Consortium, 2014).
Clinical relevance
RNA-seq는 분자 종양 프로파일링, 융합 유전자(fusion) 감지 및 발현 기반 분류의 기반이 되는 경우가 증가하고 있으며, 이러한 데이터를 해석하려면 계수(counts)가 어떻게 발현량 추정치로 변환되는지 이해해야 합니다. 이 항목은 방법과 그 정량적 특성을 설명하며, 검증된 분석법과 임상 기준에 기반한 진단적 해석이나 치료 지침을 제공하지 않습니다.
Evidence & guidelines
정량적 방법으로서의 RNA-seq에 대한 기초적인 설명(Mortazavi et al., 2008; Wang et al., 2009)은 외부 스파이크인 표준(Jiang et al., 2011) 및 RNA-seq 성능에 대한 SEQC/MAQC-III 벤치마킹(2014)을 포함한 정확성 및 재현성에 대한 커뮤니티의 노력으로 보완됩니다.
History
전사체 측정은 2000년대 후반 차세대 시퀀싱이 전체 전사체 판독 계수를 실용화하면서 발현 서열 태그(expressed-sequence-tag) 및 마이크로어레이 접근 방식에서 직접 시퀀싱으로 전환되었습니다(Mortazavi et al., 2008). RNA-seq는 발현 연구의 표준으로 빠르게 자리 잡았고, 이후 컨소시엄 작업은 측정값을 비교 가능하고 재현 가능하게 만드는 방법을 다루었습니다(SEQC/MAQC-III Consortium, 2014).
Debates
- RNA-seq 계수는 비교를 위해 어떻게 정규화되어야 합니까?
- 원시 계수는 시퀀싱 깊이와 전사체 길이에 따라 달라지며, 다른 정규화 선택은 차등 발현되는 유전자를 변경할 수 있습니다. 적절한 정규화 및 대조군 선택은 여전히 방법론적 관심사로 남아 있습니다.
Key figures
- Zhong Wang
- Michael Snyder
- Ali Mortazavi
- Barbara Wold
Related topics
Seminal works
- wang-2009
- mortazavi-2008
- seqc-2014
Frequently asked questions
- 전사체란 무엇입니까?
- 전사체는 주어진 시간에 세포나 조직에 존재하는 완전한 RNA 전사체 세트입니다. 조건과 세포 유형에 따라 변화하므로, 이를 측정하면 어떤 유전자가 어떤 수준으로 활성화되어 있는지 알 수 있습니다.
- RNA-seq는 발현 분석을 위한 마이크로어레이와 어떻게 다릅니까?
- RNA-seq는 RNA를 직접 시퀀싱하고 계수하므로 새로운 전사체와 스플라이스 변이체를 감지할 수 있으며 넓은 동적 범위를 포괄합니다. 반면 마이크로어레이는 미리 정의된 프로브에 대한 하이브리드화를 측정하며 알려진 서열로 제한됩니다.
Methods for this concept
- RNA-seq Differential Expression
- Single-cell RNA-seq analysis
- Bayesian RNA-seq differential expression
- Time-series single-cell RNA-seq analysis
- De Novo Transcriptome Assembly
- Differential single-cell RNA-seq analysis
- Multi-omics RNA-seq differential expression
- Machine learning-assisted RNA-seq differential expression