การจัดลำดับและประกอบจีโนม
การอ่านจีโนมหมายถึงการกำหนดลำดับของเบสหลายพันล้านตัว ซึ่งเครื่องจัดลำดับจะทำได้เพียงส่วนสั้นๆ เท่านั้น ทำให้ซอฟต์แวร์ต้องสร้างลำดับที่สมบูรณ์ขึ้นใหม่โดยการค้นหาจุดที่ชิ้นส่วนเหล่านั้นทับซ้อนกัน
Definition
การจัดลำดับจีโนมคือการกำหนดลำดับนิวคลีโอไทด์ของ DNA ของสิ่งมีชีวิตด้วยการทดลอง และการประกอบคือการสร้างลำดับที่สมบูรณ์ขึ้นใหม่ด้วยคอมพิวเตอร์จากข้อมูลที่อ่านได้สั้นๆ จำนวนมากที่เครื่องจัดลำดับผลิตออกมา
Scope
หัวข้อนี้ครอบคลุมถึงการจัดลำดับแบบ Sanger dideoxy หลักการของการจัดลำดับยุคใหม่และการจัดลำดับแบบอ่านยาว กลยุทธ์แบบ whole-genome shotgun และ clone-based การประกอบข้อมูลที่อ่านได้ด้วยคอมพิวเตอร์ให้เป็น contigs และ scaffolds การวัดคุณภาพของการประกอบ เช่น coverage และ contiguity และจีโนมอ้างอิงที่ได้ หัวข้อนี้จะกล่าวถึงวิธีการกำหนดลำดับของจีโนม ส่วนการตีความลำดับนั้นจะครอบคลุมในหัวข้อที่เกี่ยวข้อง
Core questions
- การจัดลำดับแบบ Sanger กำหนดลำดับของเบสโดยใช้ตัวยุติสายโซ่ได้อย่างไร?
- อะไรที่ทำให้การจัดลำดับยุคใหม่และการจัดลำดับแบบอ่านยาวเร็วขึ้นและถูกลง และมีข้อดีข้อเสียอย่างไร?
- ข้อมูลที่อ่านได้ที่ทับซ้อนกันนับล้านชิ้นถูกนำมาประกอบเป็นโครโมโซมได้อย่างไร?
- การวัดค่า coverage และ contiguity บอกอะไรเราเกี่ยวกับคุณภาพของการประกอบ?
Key concepts
- การจัดลำดับแบบ Sanger dideoxy
- การจัดลำดับยุคใหม่และการจัดลำดับแบบอ่านยาว
- กลยุทธ์แบบ Whole-genome shotgun
- การประกอบข้อมูลที่อ่านได้: contigs และ scaffolds
- Coverage, contiguity และจีโนมอ้างอิง
Mechanisms
การจัดลำดับแบบ Sanger ใช้ dideoxynucleotides ที่ยุติการสังเคราะห์สายเพื่อสร้างชุดของชิ้นส่วนที่มีความยาวแตกต่างกัน ซึ่งเผยให้เห็นลำดับ; แพลตฟอร์มแบบขนานขนาดใหญ่สามารถอ่านชิ้นส่วนนับล้านชิ้นพร้อมกัน และซอฟต์แวร์การประกอบจะตรวจจับการทับซ้อนกันระหว่างข้อมูลที่อ่านได้เพื่อรวมเข้าเป็น contigs จัดเรียงและกำหนดทิศทางเหล่านี้ให้เป็น scaffolds ตามแต่ละโครโมโซม
Clinical relevance
การจัดลำดับที่มีราคาไม่แพงทำให้การจัดลำดับจีโนมทั้งหมดและเอ็กโซมเป็นเรื่องปกติสำหรับการวินิจฉัยโรคทางพันธุกรรมที่หายาก การทำโปรไฟล์เนื้องอก การระบุเชื้อโรค และการคัดกรองทารกแรกเกิด ซึ่งเปลี่ยนการกำหนดลำดับจากโครงการสำคัญให้เป็นการทดสอบมาตรฐานในห้องปฏิบัติการ
History
Sanger ได้นำเสนอการจัดลำดับแบบ chain-termination ในปี 1977 โครงการ Human Genome Project ได้นำกลยุทธ์แบบ clone-by-clone และ shotgun มาใช้เพื่อสร้างร่างลำดับจีโนมมนุษย์ในปี 2001 และการมาถึงของการจัดลำดับยุคใหม่ในช่วงกลางทศวรรษ 2000 ตามมาด้วยแพลตฟอร์มการอ่านยาว ทำให้ต้นทุนของจีโนมมนุษย์ลดลงจากหลายพันล้านดอลลาร์เหลือเพียงไม่กี่ร้อยดอลลาร์
Key figures
- Frederick Sanger
- Eric Lander
- Craig Venter
Related topics
Seminal works
- sanger1977
- lander2001
Frequently asked questions
- ทำไมจีโนมต้องถูกประกอบขึ้นใหม่ แทนที่จะอ่านตรงๆ ไปเลย?
- เครื่องมือจัดลำดับสามารถอ่าน DNA ได้เพียงช่วงสั้นๆ ในแต่ละครั้ง ดังนั้นจีโนมจึงถูกแบ่งออกเป็นชิ้นส่วนเล็กๆ นับไม่ถ้วน จากนั้นซอฟต์แวร์การประกอบจะสร้างลำดับเดิมขึ้นใหม่โดยการตรวจจับจุดที่ชิ้นส่วนเหล่านั้นทับซ้อนกัน
- Coverage ในการจัดลำดับหมายถึงอะไร?
- Coverage คือจำนวนครั้งโดยเฉลี่ยที่แต่ละเบสในจีโนมถูกอ่าน ค่า coverage ที่สูงขึ้นจะให้ความมั่นใจมากขึ้นในการระบุแต่ละตำแหน่ง และช่วยแยกแยะความแตกต่างที่แท้จริงจากข้อผิดพลาดในการจัดลำดับ