การหาลำดับอาร์เอ็นเอและทรานสคริปโตมิกส์
การหาลำดับอาร์เอ็นเอ (RNA sequencing หรือ RNA-seq) เป็นการระบุชนิดและปริมาณของโมเลกุลอาร์เอ็นเอในตัวอย่างด้วยการหาลำดับสารพันธุกรรมแบบปริมาณมาก (high-throughput sequencing) ซึ่งให้ภาพรวมของการแสดงออกของยีนทั่วทั้งจีโนมในเชิงปริมาณ ทรานสคริปโตมิกส์คือการศึกษาชุดของทรานสคริปต์ทั้งหมด หรือที่เรียกว่าทรานสคริปโตม และการเปลี่ยนแปลงของทรานสคริปโตมระหว่างเนื้อเยื่อ สภาวะ และสถานะของโรคต่างๆ
Definition
การหาลำดับอาร์เอ็นเอเป็นวิธีการที่เปลี่ยนอาร์เอ็นเอให้เป็นคลังของชิ้นส่วนที่ถูกหาลำดับ และนับจำนวนข้อมูลลำดับที่ตรงกับยีนหรือทรานสคริปต์ เพื่อหาปริมาณการแสดงออกทั่วทั้งทรานสคริปโตม ซึ่งเป็นชุดโมเลกุลอาร์เอ็นเอทั้งหมดที่มีอยู่ในเซลล์หรือเนื้อเยื่อ
Scope
หัวข้อนี้ครอบคลุมถึงวิธีการที่ RNA-seq เปลี่ยนข้อมูลลำดับที่ได้ (sequence reads) ให้เป็นการประมาณค่าการแสดงออกของยีน ความหมายของทรานสคริปโตมในฐานะข้อมูลที่เปลี่ยนแปลงได้ หน่วยการวัดเชิงปริมาณที่ใช้กันทั่วไป และประเด็นด้านคุณภาพและการสร้างมาตรฐานที่เฉพาะเจาะจงกับการวัดด้วยการหาลำดับสารพันธุกรรม โดยจะพิจารณา RNA-seq ในฐานะแพลตฟอร์มสำหรับการวัดและการค้นพบ มากกว่าจะเป็นระเบียบวิธีทดสอบทางคลินิก
Core questions
- ข้อมูลลำดับที่ได้ถูกแปลงเป็นค่าประมาณการแสดงออกเชิงปริมาณได้อย่างไร?
- ทรานสคริปโตมจับข้อมูลอะไรได้บ้างนอกเหนือจากรายการยีนที่กำหนดไว้?
- การปรับให้เป็นมาตรฐานและความลึกของการหาลำดับส่งผลต่อความสามารถในการเปรียบเทียบอย่างไร?
- ความแม่นยำและความสามารถในการทำซ้ำของ RNA-seq ถูกประเมินอย่างไร?
Key concepts
- ทรานสคริปโตม
- การจัดเรียงและการนับข้อมูลลำดับ
- การปรับให้เป็นมาตรฐาน (เช่น การปรับตามความลึกและความยาว)
- การแสดงออกที่แตกต่างกัน
- ชุดควบคุม Spike-in
- ทรานสคริปโตมิกส์แบบเซลล์เดี่ยวและแบบรวม
Mechanisms
อาร์เอ็นเอจะถูกสกัด, ถอดรหัสย้อนกลับเป็น cDNA, ทำให้เป็นชิ้นส่วน, และเตรียมเป็นคลังสำหรับการหาลำดับ; ข้อมูลลำดับที่ได้จะถูกจัดเรียงเข้ากับจีโนมอ้างอิงหรือทรานสคริปโตมอ้างอิง, และจำนวนข้อมูลลำดับที่ทับซ้อนกับแต่ละคุณลักษณะจะให้ค่าการนับที่เป็นสัดส่วนกับการแสดงออกของยีน (Mortazavi et al., 2008) เนื่องจากความลึกของการหาลำดับทั้งหมดและความยาวของทรานสคริปต์มีผลต่อค่าการนับดิบ, ข้อมูลจึงต้องถูกปรับให้เป็นมาตรฐานก่อนที่จะสามารถเปรียบเทียบทรานสคริปต์ได้, และปริมาณมักจะแสดงในหน่วยที่ปรับตามความยาวและความลึก RNA-seq สามารถตรวจจับทรานสคริปต์ใหม่, รูปแบบการต่อของยีน (splice variants), และช่วงการแสดงออกที่กว้างมาก, ซึ่งทำให้แตกต่างจากการทำโปรไฟล์แบบไฮบริไดเซชันในยุคก่อนหน้า (Wang et al., 2009) มีการใช้มาตรฐาน spike-in ภายนอกและการเปรียบเทียบมาตรฐานโดยกลุ่มความร่วมมือเพื่อระบุความแม่นยำและข้อจำกัดของแพลตฟอร์ม (Jiang et al., 2011; SEQC/MAQC-III Consortium, 2014)
Clinical relevance
RNA-seq มีบทบาทสำคัญมากขึ้นในการทำโปรไฟล์เนื้องอกระดับโมเลกุล การตรวจหาการหลอมรวมของยีน (fusion detection) และการจำแนกประเภทตามการแสดงออกของยีน การตีความข้อมูลดังกล่าวจำเป็นต้องเข้าใจว่าค่าการนับกลายเป็นค่าประมาณการแสดงออกได้อย่างไร บทความนี้อธิบายถึงวิธีการและคุณสมบัติเชิงปริมาณของมัน แต่ไม่ได้ให้การตีความเพื่อการวินิจฉัยหรือคำแนะนำในการรักษา ซึ่งขึ้นอยู่กับการทดสอบที่ได้รับการตรวจสอบและเกณฑ์ทางคลินิก
Evidence & guidelines
คำอธิบายพื้นฐานของ RNA-seq ในฐานะวิธีการเชิงปริมาณ (Mortazavi et al., 2008; Wang et al., 2009) ได้รับการเสริมด้วยความพยายามของชุมชนวิชาการด้านความแม่นยำและการทำซ้ำได้ รวมถึงมาตรฐาน spike-in ภายนอก (Jiang et al., 2011) และการเปรียบเทียบประสิทธิภาพของ RNA-seq โดย SEQC/MAQC-III (2014)
History
การวัดทรานสคริปโตมได้เปลี่ยนจากการใช้แท็กแสดงลำดับยีน (expressed-sequence-tag) และไมโครอะเรย์ไปสู่การหาลำดับโดยตรงในช่วงปลายทศวรรษ 2000 เมื่อเทคโนโลยีการหาลำดับยุคใหม่ (next-generation sequencing) ทำให้การนับข้อมูลลำดับทั่วทั้งทรานสคริปโตมเป็นไปได้ในทางปฏิบัติ (Mortazavi et al., 2008) RNA-seq ได้กลายเป็นมาตรฐานสำหรับการศึกษาการแสดงออกของยีนอย่างรวดเร็ว และงานวิจัยของกลุ่มความร่วมมือในเวลาต่อมาได้กล่าวถึงวิธีการทำให้การวัดผลสามารถเปรียบเทียบและทำซ้ำได้ (SEQC/MAQC-III Consortium, 2014)
Debates
- ควรปรับค่าการนับ RNA-seq ให้เป็นมาตรฐานสำหรับการเปรียบเทียบอย่างไร?
- ค่าการนับดิบขึ้นอยู่กับความลึกของการหาลำดับและความยาวของทรานสคริปต์ และการเลือกวิธีการปรับให้เป็นมาตรฐานที่แตกต่างกันสามารถเปลี่ยนยีนที่แสดงออกแตกต่างกันได้ การเลือกวิธีการปรับให้เป็นมาตรฐานและการควบคุมที่เหมาะสมยังคงเป็นข้อกังวลทางระเบียบวิธีวิจัย
Key figures
- Zhong Wang
- Michael Snyder
- Ali Mortazavi
- Barbara Wold
Related topics
Seminal works
- wang-2009
- mortazavi-2008
- seqc-2014
Frequently asked questions
- ทรานสคริปโตมคืออะไร?
- ทรานสคริปโตมคือชุดของทรานสคริปต์ RNA ทั้งหมดที่มีอยู่ในเซลล์หรือเนื้อเยื่อ ณ เวลาใดเวลาหนึ่ง เนื่องจากมันเปลี่ยนแปลงไปตามสภาวะและชนิดของเซลล์ การวัดทรานสคริปโตมจึงแสดงให้เห็นว่ายีนใดบ้างที่ทำงานอยู่และในระดับใด
- RNA-seq แตกต่างจากไมโครอะเรย์สำหรับการแสดงออกของยีนอย่างไร?
- RNA-seq ทำการหาลำดับและนับ RNA โดยตรง จึงสามารถตรวจจับทรานสคริปต์ใหม่และรูปแบบการต่อของยีนได้ และครอบคลุมช่วงการแสดงออกที่กว้างมาก ในขณะที่ไมโครอะเรย์วัดการไฮบริไดเซชันกับโพรบที่กำหนดไว้ล่วงหน้าและจำกัดอยู่เฉพาะลำดับที่ทราบเท่านั้น
Methods for this concept
- RNA-seq Differential Expression
- Single-cell RNA-seq analysis
- Bayesian RNA-seq differential expression
- Time-series single-cell RNA-seq analysis
- De Novo Transcriptome Assembly
- Differential single-cell RNA-seq analysis
- Multi-omics RNA-seq differential expression
- Machine learning-assisted RNA-seq differential expression