Copy Number Variants: การตรวจจับและการจำแนกประเภท
Copy-number variant (CNV) คือส่วนของ DNA ที่มีจำนวนสำเนาแตกต่างกันไปในแต่ละบุคคล ซึ่งเพิ่มขึ้นจากการเพิ่มจำนวน (duplication) หรือลดลงจากการขาดหายไป (deletion) เมื่อเทียบกับจีโนมอ้างอิง CNV เป็นองค์ประกอบหลักของการแปรผันโครงสร้าง และคำถามเชิงระเบียบวิธีวิจัยที่สำคัญคือจะตรวจจับ CNV ได้อย่างน่าเชื่อถือจากข้อมูลอาร์เรย์หรือข้อมูลการจัดลำดับได้อย่างไร และจะจำแนกประเภทตามขนาด สถานะสำเนา และความสำคัญที่เป็นไปได้อย่างไร
Definition
Copy-number variant คือส่วนของ DNA ซึ่งโดยทั่วไปมีขนาดตั้งแต่หนึ่งกิโลเบสขึ้นไป ที่มีจำนวนสำเนาแตกต่างกันเมื่อเทียบกับจีโนมอ้างอิง ซึ่งเกิดขึ้นจากการขาดหายไป (การสูญเสียสำเนา) หรือการเพิ่มจำนวนหรือการขยายจำนวนสำเนาที่สูงขึ้น (การเพิ่มสำเนา)
Scope
หัวข้อนี้ครอบคลุมถึงความหมายของ CNV เทคโนโลยีหลักที่ใช้ในการตรวจจับและกำหนดขนาด (array comparative genomic hybridization, SNP arrays และ read-depth หรือ paired-end signals จากการจัดลำดับ) และหลักเกณฑ์ที่ใช้ในการจำแนกประเภท ได้แก่ การเพิ่มขึ้นเทียบกับการลดลง จำนวนสำเนา การเกิดซ้ำ และความถี่ นี่คือการอ้างอิงแนวคิดการตรวจจับและการจำแนกประเภท และไม่ได้ให้การตีความเพื่อการวินิจฉัยสำหรับแต่ละบุคคล
Core questions
- อะไรคือสิ่งที่ทำให้ copy-number variant แตกต่างจาก structural variant อื่นๆ?
- สัญญาณใดบ้าง — ความเข้มของการจับคู่, ความลึกของการอ่าน, หลักฐาน paired-end และ split-read — ที่ใช้ในการระบุ CNV?
- CNV ถูกจำแนกประเภทอย่างไรตามสถานะสำเนา, ขนาด, การเกิดซ้ำ และความถี่ในประชากร?
- ข้อจำกัดด้านความละเอียดและแหล่งที่มาของข้อผิดพลาดของแต่ละแพลตฟอร์มการตรวจจับคืออะไร?
Key concepts
- การเพิ่มสำเนา (duplication) และการสูญเสียสำเนา (deletion)
- Array comparative genomic hybridization (aCGH)
- SNP array log R ratio และ B-allele frequency
- การตรวจจับ read-depth และ paired-end
- ความละเอียดของจุดแตกหัก
- CNV ที่เกิดซ้ำเทียบกับไม่เกิดซ้ำ
- ความถี่ในประชากรและการจำแนกประเภทเป็นไม่เป็นอันตรายเทียบกับก่อโรค
Mechanisms
การตรวจจับ CNV จะแปลงการเปลี่ยนแปลงทางกายภาพของปริมาณ DNA ให้เป็นสัญญาณที่วัดได้ Array comparative genomic hybridization และ SNP arrays อ่านความเข้มของการจับคู่สัมพัทธ์ ดังนั้นการขาดหายไปจะลดสัญญาณลง และการเพิ่มจำนวนจะเพิ่มสัญญาณขึ้นตลอดช่วงที่ได้รับผลกระทบ; SNP arrays เพิ่มข้อมูลอัตราส่วนอัลลีลที่ช่วยแยกแยะสถานะสำเนา วิธีการที่ใช้การจัดลำดับจะอนุมานจำนวนสำเนาจากความลึกของการอ่าน — การอ่านที่มากขึ้นจะสะสมในบริเวณที่เพิ่มจำนวน และน้อยลงในบริเวณที่ขาดหายไป — และใช้การจัดเรียงแบบ paired-end และ split-read ที่ไม่สอดคล้องกันเพื่อระบุตำแหน่งจุดแตกหัก จากนั้นการจำแนกประเภทจะรวมสถานะสำเนา ขนาด ไม่ว่าตัวแปรจะเกิดซ้ำที่จุดแตกหักที่กำหนดโดยโครงสร้างหรือไม่ และความถี่ในประชากรอ้างอิง
Clinical relevance
การวิเคราะห์จำนวนสำเนาถูกนำมาใช้อย่างแพร่หลายในวิทยาศาสตร์สุขภาพเพื่อระบุลักษณะการเพิ่มขึ้นและการสูญเสียของจีโนม และการแยกแยะ CNV ทั่วไปที่ไม่เป็นอันตรายออกจากเหตุการณ์ที่เปลี่ยนแปลงปริมาณยาที่หายากเป็นสิ่งสำคัญในการตีความข้อมูลจีโนม ข้อมูลนี้อธิบายถึงวิธีการตรวจจับและจัดหมวดหมู่ CNV ในฐานะที่เป็นเรื่องของระเบียบวิธีวิจัย; ไม่ใช่พื้นฐานสำหรับการวินิจฉัยหรือการจัดการรายบุคคล
Epidemiology
การสำรวจจีโนมทั่วทั้งจีโนมในระยะแรกได้ยืนยันว่า CNV เป็นเรื่องปกติในบุคคลที่มีสุขภาพดี: Sebat และคณะเป็นกลุ่มแรกที่แสดงให้เห็นถึงความหลากหลายของจำนวนสำเนาที่แพร่หลาย และ Redon และคณะได้ทำแผนที่ CNV ทั่วโลกในประชากร HapMap แคตตาล็อกที่ใช้การจัดลำดับในภายหลัง รวมถึงแผนที่ความหลากหลายของโครงสร้างของโครงการ 1000 Genomes ได้ปรับปรุงความถี่และแสดงให้เห็นว่าการขาดหายไปและการเพิ่มจำนวนรวมกันครอบคลุมส่วนใหญ่ของจีโนมที่มีความหลากหลาย
History
การตระหนักว่าจำนวนสำเนาแตกต่างกันอย่างกว้างขวางในหมู่ผู้ที่มีสุขภาพดีเกิดขึ้นในปี 2004 จากการศึกษาอาร์เรย์โดย Sebat และโดย Iafrate และคณะ ซึ่งล้มล้างสมมติฐานที่ว่าความหลากหลายดังกล่าวหายาก แผนที่ CNV ทั่วทั้งจีโนมจากแพลตฟอร์มอาร์เรย์ตามมาในปี 2006 และการเปลี่ยนไปใช้การจัดลำดับที่มีปริมาณงานสูงในทศวรรษถัดมาได้นำวิธีการ read-depth และ paired-end มาใช้ ซึ่งช่วยปรับปรุงความละเอียดของจุดแตกหักและรวมการระบุ CNV เข้ากับการค้นพบความหลากหลายของโครงสร้างทั่วไป
Debates
- ควรประนีประนอมความแตกต่างของแพลตฟอร์มการตรวจจับอย่างไร?
- อาร์เรย์และเครื่องมือระบุที่ใช้การจัดลำดับรายงานชุด CNV ที่ทับซ้อนกันแต่ไม่เหมือนกัน โดยมีความแตกต่างกันในความละเอียดของขนาด ความแม่นยำของจุดแตกหัก และความไวในบริเวณที่ซ้ำกัน ดังนั้นการประสานการระบุและความถี่ข้ามแพลตฟอร์มยังคงเป็นความท้าทายทางระเบียบวิธีวิจัยที่ได้รับการยอมรับ
Key figures
- Jonathan Sebat
- Stephen W. Scherer
- Charles Lee
- Evan E. Eichler
- Nigel P. Carter
Related topics
Seminal works
- sebat-2004
- redon-2006
- alkan-2011
Frequently asked questions
- CNV แตกต่างจากการขาดหายไปอย่างไร?
- การขาดหายไปเป็น CNV ชนิดหนึ่ง (การสูญเสียสำเนา) คำว่า CNV กว้างกว่าและยังรวมถึงการเพิ่มจำนวนและการเพิ่มสำเนาที่สูงขึ้นด้วย ดังนั้นการขาดหายไปทุกขนาดที่เกี่ยวข้องจึงเป็น CNV แต่ไม่ใช่ทุก CNV ที่เป็นการขาดหายไป
- เหตุใดแพลตฟอร์มสองแพลตฟอร์มจึงสามารถรายงาน CNV ที่แตกต่างกันสำหรับตัวอย่างเดียวกันได้?
- วิธีการอาร์เรย์และการจัดลำดับมีความแตกต่างกันในด้านความละเอียด ความแม่นยำของจุดแตกหัก และความไวภายในบริเวณที่ซ้ำกัน ดังนั้นจึงจับชุดของตัวแปรที่ทับซ้อนกันแต่ไม่เหมือนกัน และอาจกำหนดขนาดของเหตุการณ์เดียวกันแตกต่างกันไป
Methods for this concept
- Copy Number Variation Analysis
- Machine learning-assisted copy number variation analysis
- Bayesian Copy Number Variation Analysis
- Differential Copy Number Variation Analysis
- Single-cell Copy Number Variation Analysis
- Variant Calling
- Time-series copy number variation analysis
- Network-based copy number variation analysis