ทำไมจีโนมต้องถูกประกอบขึ้นใหม่ แทนที่จะอ่านตรงๆ ไปเลย?

เครื่องมือจัดลำดับสามารถอ่าน DNA ได้เพียงช่วงสั้นๆ ในแต่ละครั้ง ดังนั้นจีโนมจึงถูกแบ่งออกเป็นชิ้นส่วนเล็กๆ นับไม่ถ้วน จากนั้นซอฟต์แวร์การประกอบจะสร้างลำดับเดิมขึ้นใหม่โดยการตรวจจับจุดที่ชิ้นส่วนเหล่านั้นทับซ้อนกัน

Coverage ในการจัดลำดับหมายถึงอะไร?

Coverage คือจำนวนครั้งโดยเฉลี่ยที่แต่ละเบสในจีโนมถูกอ่าน ค่า coverage ที่สูงขึ้นจะให้ความมั่นใจมากขึ้นในการระบุแต่ละตำแหน่ง และช่วยแยกแยะความแตกต่างที่แท้จริงจากข้อผิดพลาดในการจัดลำดับ

การจัดลำดับและประกอบจีโนม

การอ่านจีโนมหมายถึงการกำหนดลำดับของเบสหลายพันล้านตัว ซึ่งเครื่องจัดลำดับจะทำได้เพียงส่วนสั้นๆ เท่านั้น ทำให้ซอฟต์แวร์ต้องสร้างลำดับที่สมบูรณ์ขึ้นใหม่โดยการค้นหาจุดที่ชิ้นส่วนเหล่านั้นทับซ้อนกัน

ค้นหาหัวข้อด้วย PaperMindเร็ว ๆ นี้Find papers & topics

Tools & resources

ดาวน์โหลดสไลด์

Learn & explore

วิดีโอเร็ว ๆ นี้

Definition

การจัดลำดับจีโนมคือการกำหนดลำดับนิวคลีโอไทด์ของ DNA ของสิ่งมีชีวิตด้วยการทดลอง และการประกอบคือการสร้างลำดับที่สมบูรณ์ขึ้นใหม่ด้วยคอมพิวเตอร์จากข้อมูลที่อ่านได้สั้นๆ จำนวนมากที่เครื่องจัดลำดับผลิตออกมา

Scope

หัวข้อนี้ครอบคลุมถึงการจัดลำดับแบบ Sanger dideoxy หลักการของการจัดลำดับยุคใหม่และการจัดลำดับแบบอ่านยาว กลยุทธ์แบบ whole-genome shotgun และ clone-based การประกอบข้อมูลที่อ่านได้ด้วยคอมพิวเตอร์ให้เป็น contigs และ scaffolds การวัดคุณภาพของการประกอบ เช่น coverage และ contiguity และจีโนมอ้างอิงที่ได้ หัวข้อนี้จะกล่าวถึงวิธีการกำหนดลำดับของจีโนม ส่วนการตีความลำดับนั้นจะครอบคลุมในหัวข้อที่เกี่ยวข้อง

Core questions

การจัดลำดับแบบ Sanger กำหนดลำดับของเบสโดยใช้ตัวยุติสายโซ่ได้อย่างไร?
อะไรที่ทำให้การจัดลำดับยุคใหม่และการจัดลำดับแบบอ่านยาวเร็วขึ้นและถูกลง และมีข้อดีข้อเสียอย่างไร?
ข้อมูลที่อ่านได้ที่ทับซ้อนกันนับล้านชิ้นถูกนำมาประกอบเป็นโครโมโซมได้อย่างไร?
การวัดค่า coverage และ contiguity บอกอะไรเราเกี่ยวกับคุณภาพของการประกอบ?

Key concepts

การจัดลำดับแบบ Sanger dideoxy
การจัดลำดับยุคใหม่และการจัดลำดับแบบอ่านยาว
กลยุทธ์แบบ Whole-genome shotgun
การประกอบข้อมูลที่อ่านได้: contigs และ scaffolds
Coverage, contiguity และจีโนมอ้างอิง

Mechanisms

การจัดลำดับแบบ Sanger ใช้ dideoxynucleotides ที่ยุติการสังเคราะห์สายเพื่อสร้างชุดของชิ้นส่วนที่มีความยาวแตกต่างกัน ซึ่งเผยให้เห็นลำดับ; แพลตฟอร์มแบบขนานขนาดใหญ่สามารถอ่านชิ้นส่วนนับล้านชิ้นพร้อมกัน และซอฟต์แวร์การประกอบจะตรวจจับการทับซ้อนกันระหว่างข้อมูลที่อ่านได้เพื่อรวมเข้าเป็น contigs จัดเรียงและกำหนดทิศทางเหล่านี้ให้เป็น scaffolds ตามแต่ละโครโมโซม

Clinical relevance

การจัดลำดับที่มีราคาไม่แพงทำให้การจัดลำดับจีโนมทั้งหมดและเอ็กโซมเป็นเรื่องปกติสำหรับการวินิจฉัยโรคทางพันธุกรรมที่หายาก การทำโปรไฟล์เนื้องอก การระบุเชื้อโรค และการคัดกรองทารกแรกเกิด ซึ่งเปลี่ยนการกำหนดลำดับจากโครงการสำคัญให้เป็นการทดสอบมาตรฐานในห้องปฏิบัติการ

History

Sanger ได้นำเสนอการจัดลำดับแบบ chain-termination ในปี 1977 โครงการ Human Genome Project ได้นำกลยุทธ์แบบ clone-by-clone และ shotgun มาใช้เพื่อสร้างร่างลำดับจีโนมมนุษย์ในปี 2001 และการมาถึงของการจัดลำดับยุคใหม่ในช่วงกลางทศวรรษ 2000 ตามมาด้วยแพลตฟอร์มการอ่านยาว ทำให้ต้นทุนของจีโนมมนุษย์ลดลงจากหลายพันล้านดอลลาร์เหลือเพียงไม่กี่ร้อยดอลลาร์

Key figures

Frederick Sanger
Eric Lander
Craig Venter

Seminal works

sanger1977
lander2001

Frequently asked questions

ทำไมจีโนมต้องถูกประกอบขึ้นใหม่ แทนที่จะอ่านตรงๆ ไปเลย?: เครื่องมือจัดลำดับสามารถอ่าน DNA ได้เพียงช่วงสั้นๆ ในแต่ละครั้ง ดังนั้นจีโนมจึงถูกแบ่งออกเป็นชิ้นส่วนเล็กๆ นับไม่ถ้วน จากนั้นซอฟต์แวร์การประกอบจะสร้างลำดับเดิมขึ้นใหม่โดยการตรวจจับจุดที่ชิ้นส่วนเหล่านั้นทับซ้อนกัน
Coverage ในการจัดลำดับหมายถึงอะไร?: Coverage คือจำนวนครั้งโดยเฉลี่ยที่แต่ละเบสในจีโนมถูกอ่าน ค่า coverage ที่สูงขึ้นจะให้ความมั่นใจมากขึ้นในการระบุแต่ละตำแหน่ง และช่วยแยกแยะความแตกต่างที่แท้จริงจากข้อผิดพลาดในการจัดลำดับ