เทคโนโลยีการจัดลำดับสารพันธุกรรมยุคใหม่
การจัดลำดับสารพันธุกรรมยุคใหม่ (NGS) หรือที่เรียกว่าการจัดลำดับสารพันธุกรรมแบบปริมาณมาก (high-throughput) หรือแบบขนานจำนวนมาก (massively parallel sequencing) หมายถึงแพลตฟอร์มที่สามารถอ่านชิ้นส่วนดีเอ็นเอหลายล้านถึงหลายพันล้านชิ้นพร้อมกัน แทนที่วิธีการของแซงเกอร์ที่อ่านทีละหนึ่งชิ้น เทคโนโลยีเหล่านี้ช่วยลดต้นทุนการจัดลำดับสารพันธุกรรมลงอย่างมาก และทำให้การศึกษาจีโนมทั้งหมด เอ็กโซม และทรานสคริปโตมกลายเป็นเรื่องปกติ
Definition
เทคโนโลยีการจัดลำดับสารพันธุกรรมยุคใหม่คือแพลตฟอร์มที่กำหนดลำดับนิวคลีโอไทด์โดยการอ่านชิ้นส่วนดีเอ็นเอจำนวนมากพร้อมกัน ทำให้ได้ข้อมูลปริมาณมากด้วยต้นทุนต่อเบสที่ต่ำ ซึ่งแตกต่างจากการอ่านแบบอิเล็กโทรฟอเรซิสตามลำดับของการจัดลำดับแบบแซงเกอร์
Scope
บทความนี้สำรวจกลุ่มแพลตฟอร์มการจัดลำดับสารพันธุกรรมแบบปริมาณมาก รวมถึงการจัดลำดับแบบอ่านสั้นด้วยวิธี sequencing-by-synthesis และวิธีการแบบอ่านยาวที่ใช้โมเลกุลเดี่ยว เช่น nanopore และ single-molecule real-time sequencing รวมถึงการแลกเปลี่ยนระหว่างความยาวของการอ่านและความแม่นยำที่ทำให้แต่ละวิธีแตกต่างกัน และผลกระทบต่อขนาดของจีโนมิกส์ นี่คือภาพรวมของระเบียบวิธีวิจัย ไม่ใช่การเปรียบเทียบเพื่อการตัดสินใจซื้อหรือการทดสอบทางคลินิก
Core questions
- อะไรคือสิ่งที่ทำให้การจัดลำดับสารพันธุกรรมยุคใหม่แตกต่างจากการจัดลำดับแบบแซงเกอร์ในยุคก่อน?
- แพลตฟอร์มแบบอ่านสั้นและแบบอ่านยาวแตกต่างกันอย่างไรในด้านความยาวของการอ่าน ความแม่นยำ และการประยุกต์ใช้?
- การจัดลำดับสารพันธุกรรมแบบปริมาณมากเปลี่ยนแปลงขนาดและต้นทุนของจีโนมิกส์ได้อย่างไร?
Key concepts
- การจัดลำดับสารพันธุกรรมแบบขนานจำนวนมาก
- การจัดลำดับสารพันธุกรรมด้วยวิธีสังเคราะห์
- แพลตฟอร์มแบบอ่านสั้นเทียบกับแบบอ่านยาว
- การจัดลำดับสารพันธุกรรมแบบโมเลกุลเดี่ยวแบบเรียลไทม์
- การจัดลำดับสารพันธุกรรมแบบนาโนพอร์
- การแลกเปลี่ยนระหว่างความยาวของการอ่านและความแม่นยำต่อเบส
- ต้นทุนต่อเบส
Mechanisms
แพลตฟอร์มแบบปริมาณมากจะตรึงและอ่านชิ้นส่วนดีเอ็นเอจำนวนมหาศาลพร้อมกัน การจัดลำดับแบบอ่านสั้นด้วยวิธี sequencing-by-synthesis จะตรวจจับแต่ละเบสเมื่อมีการรวมตัวกัน โดยมักใช้ตัวหยุดแบบย้อนกลับได้ ทำให้ได้ข้อมูลการอ่านที่สั้นแต่มีความแม่นยำสูง วิธีการแบบอ่านยาวจะอ่านโมเลกุลเดี่ยวแบบเรียลไทม์ หรือเมื่อโมเลกุลเคลื่อนผ่านรูพรุนนาโน (nanopore) ทำให้ได้ข้อมูลการอ่านที่ยาวกว่ามาก ซึ่งครอบคลุมบริเวณที่ซ้ำกันและมีโครงสร้างซับซ้อน แต่มีข้อเสียคือมีอัตราความผิดพลาดต่อเบสสูงขึ้นเล็กน้อย การเลือกระหว่างแพลตฟอร์มสะท้อนถึงการแลกเปลี่ยนระหว่างความยาวของการอ่าน ความแม่นยำ ปริมาณงาน และต้นทุน ซึ่งขึ้นอยู่กับเป้าหมายการวิเคราะห์
Clinical relevance
การจัดลำดับสารพันธุกรรมยุคใหม่เป็นหัวใจสำคัญของการวิจัยจีโนมิกส์สมัยใหม่และจีโนมิกส์ทางคลินิก ทำให้สามารถทำได้ตั้งแต่การตรวจหาความแปรปรวนไปจนถึงจีโนมิกส์ของเชื้อโรคและมะเร็ง บทความนี้อธิบายเทคโนโลยีและการแลกเปลี่ยนข้อดีข้อเสียของเทคโนโลยีเหล่านั้นเพื่อเป็นข้อมูลอ้างอิง และไม่แนะนำแพลตฟอร์มหรือการทดสอบใดเป็นพิเศษสำหรับการใช้งานส่วนบุคคล
Evidence & guidelines
สาขาวิชานี้มีเอกสารอ้างอิงผ่านบทวิจารณ์ที่มีอิทธิพลซึ่งติดตามวิวัฒนาการของแพลตฟอร์ม ได้แก่ Metzker (2010), Reuter et al. (2015), และ Goodwin et al. (2016) สำหรับภาพรวมกว้างๆ และ Wang et al. (2021) สำหรับการจัดลำดับแบบ nanopore โดยเฉพาะ; Bentley et al. (2008) เป็นรายงานหลักของการจัดลำดับแบบอ่านสั้นที่เป็นรากฐาน
History
หลังจากที่การจัดลำดับแบบแซงเกอร์ครองตลาดมาสามทศวรรษ แพลตฟอร์มเชิงพาณิชย์แบบขนานจำนวนมากก็เริ่มปรากฏขึ้นในช่วงกลางทศวรรษ 2000 โดยมีการสาธิตการจัดลำดับแบบอ่านสั้นด้วยตัวหยุดแบบย้อนกลับได้ในระดับจีโนมทั้งหมดในปี 2008 ในทศวรรษต่อมา ปริมาณงานเพิ่มขึ้นและต้นทุนลดลงอย่างรวดเร็ว ในขณะที่แพลตฟอร์มแบบอ่านยาวที่ใช้โมเลกุลเดี่ยว (single-molecule real-time และ nanopore sequencing) ก็พัฒนาจนสามารถแก้ไขข้อจำกัดด้านความยาวของการอ่านแบบสั้นได้
Key figures
- Michael Metzker
- Michael Snyder
- W. Richard McCombie
- David Bentley
Related topics
Seminal works
- metzker-2009
- goodwin-2016
- wang-2021
Frequently asked questions
- การจัดลำดับสารพันธุกรรมยุคใหม่มีอะไรเพิ่มเติมจากการจัดลำดับแบบแซงเกอร์?
- สามารถอ่านชิ้นส่วนดีเอ็นเอหลายล้านถึงหลายพันล้านชิ้นพร้อมกัน แทนที่จะอ่านทีละชิ้น ซึ่งเพิ่มปริมาณงานได้หลายเท่าตัวและลดต้นทุน ทำให้การศึกษาจีโนมทั้งหมดและการศึกษาในระดับประชากรเป็นไปได้จริง
- การแลกเปลี่ยนหลักระหว่างการจัดลำดับแบบอ่านสั้นและแบบอ่านยาวคืออะไร?
- การอ่านแบบสั้นมักจะมีความแม่นยำสูง แต่สั้นเกินไปที่จะครอบคลุมบริเวณที่ซ้ำกันยาวๆ ในขณะที่การอ่านแบบยาวครอบคลุมบริเวณที่ซ้ำกันและมีโครงสร้างซับซ้อน แต่ในอดีตมีอัตราความผิดพลาดต่อเบสสูงกว่า