ความหลากหลายของนิวคลีโอไทด์และการจำแนกประเภทของความแปรผัน
ความหลากหลายของนิวคลีโอไทด์เป็นการวัดว่าลำดับนิวคลีโอไทด์สองลำดับที่สุ่มเลือกจากประชากรมีความแตกต่างกันโดยเฉลี่ยมากน้อยเพียงใด ในขณะที่การจำแนกประเภทของความแปรผันเป็นการจัดระเบียบความแตกต่างของ DNA หลายชนิด — การแทนที่นิวคลีโอไทด์เดี่ยว, การแทรกและลบขนาดเล็ก, และการเปลี่ยนแปลงโครงสร้างที่ใหญ่ขึ้น — ให้เป็นคำศัพท์ที่สอดคล้องกัน ทั้งสองแนวคิดนี้ร่วมกันอธิบายทั้งปริมาณความแปรผันที่จีโนมมีอยู่และลักษณะของความแปรผันนั้น
Definition
ความหลากหลายของนิวคลีโอไทด์ (มักใช้สัญลักษณ์ pi) คือจำนวนความแตกต่างของนิวคลีโอไทด์โดยเฉลี่ยต่อตำแหน่งระหว่างลำดับสองลำดับที่สุ่มตัวอย่างจากประชากร; การจำแนกประเภทของความแปรผันคือการจัดหมวดหมู่อย่างเป็นระบบของความแตกต่างของลำดับที่สังเกตได้ (เช่น ความแปรผันของนิวคลีโอไทด์เดี่ยว, อินเดล, ความแปรผันเชิงโครงสร้าง)
Scope
บทความนี้ครอบคลุมมาตรการสรุปมาตรฐานของความแปรผันของลำดับภายในประชากร โดยเฉพาะความหลากหลายของนิวคลีโอไทด์และจำนวนตำแหน่งที่มีการแยกตัว และการจำแนกประเภทของความแปรผันตามขนาดและผลกระทบที่คาดการณ์ต่อลำดับ บทความนี้ถือว่าสิ่งเหล่านี้เป็นแนวคิดเชิงพรรณนาและระเบียบวิธีวิจัย โดยไม่ได้กำหนดนัยสำคัญทางคลินิกให้กับความแปรผันเฉพาะเจาะจง
Core questions
- ปริมาณความแปรผันของลำดับในตัวอย่างสรุปได้อย่างไร?
- ความหลากหลายของนิวคลีโอไทด์และจำนวนตำแหน่งที่มีการแยกตัวแตกต่างกันอย่างไรในฐานะผู้ประมาณค่า?
- ประเภทหลักของความแปรผันทางพันธุกรรมตามขนาดและชนิดคืออะไร?
- ความแปรผันถูกนำเสนอและแลกเปลี่ยนในรูปแบบไฟล์มาตรฐานได้อย่างไร?
Key concepts
- ความหลากหลายของนิวคลีโอไทด์ (pi)
- ตำแหน่งที่มีการแยกตัวและธีตาของ Watterson
- ความแปรผันของนิวคลีโอไทด์เดี่ยว (SNV/SNP)
- การแทรก-ลบ (indel)
- ความแปรผันเชิงโครงสร้าง
- อัลลีลอ้างอิงและอัลลีลทางเลือก
- รูปแบบ Variant Call Format (VCF)
Key theories
- แบบจำลองตำแหน่งอนันต์และธีตา
- ภายใต้สมมติฐานตำแหน่งอนันต์ การกลายพันธุ์ใหม่แต่ละครั้งจะเกิดขึ้นที่ตำแหน่งที่ไม่เคยมีการกลายพันธุ์มาก่อน ดังนั้นพารามิเตอร์การกลายพันธุ์ของประชากรธีตาจึงสามารถประมาณได้จากจำนวนตำแหน่งที่มีการแยกตัว (ผู้ประมาณค่าของ Watterson) หรือจากความแตกต่างเฉลี่ยเป็นคู่ (ความหลากหลายของนิวคลีโอไทด์); ความคลาดเคลื่อนอย่างเป็นระบบระหว่างทั้งสองให้ข้อมูลเกี่ยวกับการเบี่ยงเบนจากความเป็นกลาง
Mechanisms
ความแปรผันจะถูกตรวจพบครั้งแรกโดยการจัดเรียงลำดับที่ได้มาเข้ากับจีโนมอ้างอิงและระบุตำแหน่งที่แตกต่างกัน; จากนั้นความแตกต่างจะถูกจำแนกตามขนาดและรูปแบบ สถิติสรุปจะรวบรวมข้อมูลนี้ให้เป็นมาตรการระดับประชากร: จำนวนตำแหน่งที่มีการแยกตัวเป็นพื้นฐานของการประมาณค่าธีตาของ Watterson ในขณะที่ความแตกต่างเฉลี่ยเป็นคู่กำหนดความหลากหลายของนิวคลีโอไทด์ เนื่องจากทั้งสองประมาณค่าพารามิเตอร์เดียวกันภายใต้แบบจำลองที่เป็นกลางและมีขนาดคงที่ ความแตกต่างระหว่างทั้งสอง (ที่ Tajima ทำให้เป็นทางการ) จะบ่งชี้ถึงการเปลี่ยนแปลงทางประชากรหรือการคัดเลือก การนำเสนอที่เป็นมาตรฐานในรูปแบบ Variant Call Format ช่วยให้สามารถจัดเก็บ แบ่งปัน และเปรียบเทียบความแปรผันในการศึกษาต่างๆ ได้
Clinical relevance
คำศัพท์เกี่ยวกับความแปรผันที่สอดคล้องกันและการประมาณค่าความหลากหลายที่น่าเชื่อถือเป็นสิ่งจำเป็นสำหรับการตีความข้อมูลจีโนมในการตั้งค่าด้านสุขภาพ เนื่องจากมีการใช้หมวดหมู่เชิงพรรณนาเดียวกันเมื่อมีการคัดกรองจีโนมที่จัดลำดับเพื่อหาความแปรผันที่เกี่ยวข้องทางคลินิก บทความนี้อธิบายวิธีการอธิบายและนับความแปรผัน และไม่ใช่พื้นฐานสำหรับการวินิจฉัยหรือการตัดสินใจในการรักษาของแต่ละบุคคล
Evidence & guidelines
ผู้ประมาณค่าพื้นฐานของความหลากหลายของลำดับถูกกำหนดโดย Watterson และ Tajima ในขณะที่การสำรวจขนาดใหญ่ เช่น แผนที่ SNP ของมนุษย์ในยุคแรกเริ่มและข้อมูลอ้างอิงจากโครงการ 1000 Genomes Project ให้มาตราส่วนเชิงประจักษ์ของความแปรผันของมนุษย์ รูปแบบ Variant Call Format และเครื่องมือของมันเป็นมาตรฐานโดยพฤตินัยของชุมชนสำหรับการนำเสนอความแปรผันที่จำแนกประเภทแล้ว
History
พันธุศาสตร์ประชากรระดับโมเลกุลในยุคแรกเริ่มได้วัดปริมาณความแปรผันผ่านการสำรวจอัลโลไซม์และตำแหน่งการตัดของเอนไซม์ จากนั้นจึงผ่านการจัดลำดับ DNA งานของ Watterson ในปี 1975 และ Tajima ในปี 1989 ได้ให้ผู้ประมาณค่าที่ยังคงใช้มาจนถึงปัจจุบัน และแผนที่ SNP ของมนุษย์ในปี 2001 และกลุ่มความร่วมมือในการจัดลำดับในภายหลังได้เปลี่ยนการจัดทำรายการความแปรผันให้เป็นกิจการทั่วทั้งจีโนม โดยมีรูปแบบมาตรฐาน เช่น VCF สำหรับการนำเสนอความแปรผันที่เกิดขึ้น
Key figures
- G. A. Watterson
- Fumio Tajima
- Richard Durbin
- Gonçalo Abecasis
Related topics
Seminal works
- watterson-1975
- tajima-1989
- snp-map-2001
Frequently asked questions
- ความแตกต่างระหว่างความหลากหลายของนิวคลีโอไทด์และจำนวนตำแหน่งที่มีการแยกตัวคืออะไร?
- จำนวนตำแหน่งที่มีการแยกตัวนับว่ามีกี่ตำแหน่งที่แตกต่างกันในตัวอย่าง ในขณะที่ความหลากหลายของนิวคลีโอไทด์หาค่าเฉลี่ยความแตกต่างระหว่างลำดับเป็นคู่; ทั้งสองประมาณค่าพารามิเตอร์พื้นฐานเดียวกันภายใต้แบบจำลองที่เป็นกลางอย่างง่าย และความคลาดเคลื่อนระหว่างทั้งสองก็ให้ข้อมูลได้ด้วยตัวมันเอง
- SNP เหมือนกับการกลายพันธุ์หรือไม่?
- SNP คือความแปรผันของนิวคลีโอไทด์เดี่ยวที่สังเกตพบว่ามีการแยกตัวในประชากร; มันมีต้นกำเนิดมาจากการกลายพันธุ์แบบจุด แต่คำนี้เน้นว่าความแปรผันนั้นมีอยู่ในความถี่ที่สังเกตได้ แทนที่จะเป็นการเปลี่ยนแปลงที่เพิ่งเกิดขึ้นใหม่ในบุคคลเดียว