การค้นพบและการทดสอบภาระของความแปรผันที่หายาก
การศึกษา GWAS มาตรฐานมีพลังในการตรวจจับความแปรผันที่พบบ่อย แต่ความแปรผันเชิงหน้าที่ส่วนใหญ่ของจีโนมนั้นหายาก เนื่องจากความแปรผันที่หายากแต่ละรายการปรากฏในบุคคลน้อยเกินไปที่จะทดสอบได้อย่างน่าเชื่อถือทีละรายการ การวิเคราะห์ความแปรผันที่หายากจึงรวบรวมความแปรผัน — โดยทั่วไปจะอยู่ภายในยีน — และทดสอบว่าภาระรวมของพวกมันแตกต่างกันระหว่างกลุ่มผู้ป่วยและกลุ่มควบคุมหรือไม่ การจัดลำดับทำให้ความแปรผันเหล่านี้สามารถสังเกตได้ และวิธีการต่างๆ เช่น การทดสอบภาระและการทดสอบเคอร์เนลทำให้สามารถจัดการทางสถิติได้
Definition
การค้นพบความแปรผันที่หายากคือการระบุ โดยปกติด้วยการจัดลำดับ ความแปรผันทางพันธุกรรมที่มีความถี่ต่ำที่เกี่ยวข้องกับลักษณะเฉพาะ และการทดสอบภาระคือชุดของวิธีการที่อิงตามยีนหรือภูมิภาคที่รวบรวมความแปรผันที่หายากหลายรายการเข้าเป็นการทดสอบเดียวเพื่อเพิ่มพลังที่การวิเคราะห์เครื่องหมายเดี่ยวขาดไป
Scope
หัวข้อนี้ครอบคลุมถึงสาเหตุที่ความแปรผันที่หายากหลุดรอดจากการศึกษา GWAS แบบเครื่องหมายเดี่ยวทั่วไป เทคโนโลยีการจัดลำดับและแผงอ้างอิงที่เปิดเผยความแปรผันเหล่านั้น และกลยุทธ์การรวบรวมหลัก — การทดสอบภาระแบบง่าย (การรวมกลุ่ม), การทดสอบเคอร์เนลส่วนประกอบความแปรปรวน เช่น SKAT และการทดสอบแบบรวมหรือแบบเหมาะสมที่สุด เช่น SKAT-O นอกจากนี้ยังกล่าวถึงบทบาทของการระบุคำอธิบายความแปรผันในการตัดสินใจว่าจะรวบรวมความแปรผันใดบ้าง นี่คือเอกสารอ้างอิงวิธีการ ไม่ใช่แนวทางทางคลินิก
Core questions
- เหตุใด GWAS แบบเครื่องหมายเดี่ยวทั่วไปจึงขาดพลังสำหรับความแปรผันที่หายาก?
- การจัดลำดับแตกต่างจากการระบุจีโนไทป์ด้วยอาร์เรย์อย่างไรในการเปิดเผยความแปรผันที่หายาก?
- การทดสอบภาระ (การรวมกลุ่ม) รวบรวมความแปรผันที่หายากภายในยีนได้อย่างไร?
- การทดสอบแบบเคอร์เนล เช่น SKAT แตกต่างจากการทดสอบภาระแบบง่ายอย่างไร?
- เมื่อใดที่สมมติว่าความแปรผันมีผลในทิศทางเดียวกัน และจะเกิดอะไรขึ้นเมื่อความแปรผันเหล่านั้นไม่มีผลในทิศทางเดียวกัน?
Key concepts
- ความแปรผันที่หายากและความถี่ต่ำ
- การจัดลำดับทั้งเอ็กโซมและทั้งจีโนม
- การรวบรวมตามยีนหรือภูมิภาค
- การทดสอบภาระ / การรวมกลุ่ม
- การทดสอบความสัมพันธ์เคอร์เนลลำดับ (SKAT)
- การทดสอบแบบรวมและแบบเหมาะสมที่สุด (SKAT-O)
- การระบุคำอธิบายเชิงหน้าที่และการถ่วงน้ำหนักความแปรผัน
Mechanisms
การทดสอบความสัมพันธ์แบบเครื่องหมายเดี่ยวจะสูญเสียพลังเมื่อความแปรผันถูกพาหะโดยบุคคลเพียงไม่กี่คน ดังนั้นวิธีการสำหรับความแปรผันที่หายากจึงรวบรวมความแปรผันทั่วทั้งยีนหรือภูมิภาค การทดสอบภาระ (การรวมกลุ่ม) จะสรุปความแปรผันที่หายากในหน่วยเป็นจำนวนหรือตัวบ่งชี้เดียว และทดสอบว่าภาระนั้นแตกต่างกันระหว่างกลุ่มผู้ป่วยและกลุ่มควบคุมหรือไม่ การทดสอบเหล่านี้มีพลังเมื่อความแปรผันส่วนใหญ่ส่งผลต่อลักษณะในทิศทางเดียวกัน แต่จะสูญเสียพลังเมื่อผลกระทบมีทิศทางที่หลากหลาย หรือความแปรผันจำนวนมากเป็นกลาง การทดสอบเคอร์เนลส่วนประกอบความแปรปรวน ซึ่งมีตัวอย่างคือ Sequence Kernel Association Test (SKAT) จะทดสอบว่าการกระจายของผลกระทบความแปรผันเบี่ยงเบนจากค่าว่างหรือไม่ โดยไม่สมมติทิศทางร่วมกัน และยังคงมีพลังเมื่อผลกระทบมีความหลากหลาย วิธีการแบบรวม เช่น SKAT-O จะผสมผสานการทดสอบภาระและการทดสอบเคอร์เนลอย่างปรับเปลี่ยนได้เพื่อให้ทำงานได้ดีในทุกสถานการณ์ เนื่องจากการรวบรวมขึ้นอยู่กับการเลือกความแปรผันที่จะรวม การระบุคำอธิบายเชิงหน้าที่และการถ่วงน้ำหนักตามความถี่จึงถูกนำมาใช้เพื่อมุ่งเน้นไปที่ความแปรผันที่อาจเป็นอันตราย การจัดลำดับและแผงอ้างอิงที่หลากหลาย เช่น โครงการ 1000 Genomes เป็นพื้นฐานของการค้นพบและการระบุคำอธิบายของความแปรผันที่หายากที่การทดสอบเหล่านี้วิเคราะห์
Clinical relevance
วิธีการสำหรับความแปรผันที่หายากขยายการค้นพบทางพันธุกรรมไปสู่ความแปรผันที่มีแนวโน้มที่จะทำงานได้และใกล้เคียงกับชีววิทยาพื้นฐานมากขึ้น ซึ่งเสริมการศึกษา GWAS สำหรับความแปรผันที่พบบ่อย หัวข้อนี้อธิบายวิธีการวิเคราะห์และไม่ใช่พื้นฐานสำหรับการตีความความแปรผันแต่ละรายการ การวินิจฉัย หรือการตัดสินใจในการรักษา
Evidence & guidelines
พื้นฐานทางระเบียบวิธีมาจากวรรณกรรมพันธุศาสตร์เชิงสถิติมากกว่าแนวทางทางคลินิก Wu et al. (2011) ได้นำเสนอ SKAT สำหรับข้อมูลการจัดลำดับ; Lee et al. (2012) ได้พัฒนาการทดสอบแบบรวมที่เหมาะสมที่สุด (SKAT-O); โครงการ 1000 Genomes (2015) ได้ให้ข้อมูลอ้างอิงสำหรับความแปรผันที่หายาก; และ Manolio et al. (2009) ได้ระบุว่าความแปรผันที่หายากเป็นแหล่งหนึ่งของพันธุกรรมที่ไม่ได้ถูกจับโดย GWAS สำหรับความแปรผันที่พบบ่อย
History
เมื่อ GWAS สำหรับความแปรผันที่พบบ่อยเติบโตเต็มที่และยังคงมีพันธุกรรมที่อธิบายไม่ได้ ความสนใจก็หันไปที่ความแปรผันที่หายากที่อาร์เรย์ไม่สามารถจับได้ การแพร่หลายของการจัดลำดับเอ็กโซมและจีโนมในราคาที่เข้าถึงได้ประมาณปี 2010 ทำให้ความแปรผันที่หายากสามารถสังเกตได้ในวงกว้าง และตามมาด้วยวิธีการรวบรวมจำนวนมาก: การทดสอบการรวมกลุ่มแบบง่าย จากนั้นเป็นการทดสอบเคอร์เนลส่วนประกอบความแปรปรวน เช่น SKAT ในปี 2011 และการรวมกันแบบปรับเปลี่ยนได้ เช่น SKAT-O ในปี 2012 ตั้งแต่นั้นมา กลุ่มความร่วมมือการจัดลำดับขนาดใหญ่และการศึกษาเอ็กโซมของธนาคารชีวภาพได้นำวิธีการเหล่านี้ไปใช้อย่างกว้างขวาง แม้ว่าการตรวจจับสัญญาณความแปรผันที่หายากยังคงต้องการตัวอย่างขนาดใหญ่มาก
Debates
- เมื่อใดที่ควรเลือกใช้การทดสอบภาระมากกว่าการทดสอบเคอร์เนล?
- การทดสอบภาระมีพลังมากที่สุดเมื่อความแปรผันที่รวบรวมมีผลในทิศทางที่สอดคล้องกัน ในขณะที่การทดสอบเคอร์เนล เช่น SKAT มีความทนทานต่อทิศทางผลกระทบที่หลากหลายและความแปรผันที่เป็นกลางจำนวนมากมากกว่า การทดสอบแบบรวมมีเป้าหมายที่จะป้องกันความเสี่ยง แต่การเลือกที่ถูกต้องขึ้นอยู่กับโครงสร้างที่แท้จริงของยีนที่ไม่ทราบ
Key figures
- Xihong Lin
- Michael Wu
- Seunggeun Lee
- Michael Boehnke
- Teri Manolio
Related topics
Seminal works
- wu-2011
- lee-2012
- manolio-2009
Frequently asked questions
- เหตุใด GWAS จึงไม่สามารถทดสอบความแปรผันที่หายากทีละรายการได้?
- ความแปรผันที่ถูกพาหะโดยบุคคลเพียงไม่กี่คนให้ข้อมูลทางสถิติน้อยเกินไปสำหรับการทดสอบเครื่องหมายเดี่ยวที่น่าเชื่อถือ ดังนั้นวิธีการสำหรับความแปรผันที่หายากจึงรวบรวมความแปรผันจำนวนมาก — โดยปกติจะอยู่ภายในยีน — เพื่อเพิ่มพลัง
- SKAT แตกต่างจากการทดสอบภาระแบบง่ายอย่างไร?
- การทดสอบภาระสมมติว่าความแปรผันที่รวบรวมมีผลส่วนใหญ่ในทิศทางเดียวกัน ในขณะที่ SKAT เป็นการทดสอบส่วนประกอบความแปรปรวนที่ตรวจจับการเบี่ยงเบนจากค่าว่างแม้ว่าผลกระทบของความแปรผันจะแตกต่างกันในทิศทางหรือขนาด ทำให้มีความทนทานต่อผลกระทบที่หลากหลายมากกว่า