การศึกษาความสัมพันธ์ทั่วทั้งจีโนมและการค้นพบความแปรผัน
การศึกษาความสัมพันธ์ทั่วทั้งจีโนม (GWAS) จะสแกนหาความแปรผันทางพันธุกรรมหลายแสนถึงหลายล้านตำแหน่งทั่วทั้งจีโนมของบุคคลจำนวนมาก เพื่อค้นหาตำแหน่งที่ความถี่ของอัลลีลแตกต่างกันอย่างเป็นระบบระหว่างผู้ที่มีและไม่มีลักษณะหรือโรค การทดสอบจีโนมทั้งหมดโดยไม่มีสมมติฐานเบื้องต้นว่ายีนใดเกี่ยวข้อง ทำให้ GWAS เปลี่ยนการค้นหาพื้นฐานทางพันธุกรรมของภาวะที่ซับซ้อนและพบบ่อย จากการคาดเดาหายีนที่เกี่ยวข้อง ไปสู่การค้นพบที่เป็นระบบและปราศจากสมมติฐาน
Definition
การศึกษาความสัมพันธ์ทั่วทั้งจีโนมเป็นการศึกษาทางพันธุกรรมเชิงสังเกตที่ทดสอบความสัมพันธ์ระหว่างฟีโนไทป์กับความแปรผันทางพันธุกรรม ซึ่งโดยทั่วไปคือ single-nucleotide polymorphisms ที่ถูกระบุจีโนไทป์หรือประมาณค่าทั่วทั้งจีโนม โดยจะประกาศความสัมพันธ์ที่ตำแหน่งความแปรผันซึ่งมีหลักฐานทางสถิติผ่านเกณฑ์นัยสำคัญทั่วทั้งจีโนม
Scope
ส่วนนี้จะแนะนำผู้อ่านให้รู้จักกับกลุ่มของวิธีการและแนวคิดที่เกี่ยวข้องกับการค้นพบความแปรผันในประชากรที่ไม่เกี่ยวข้องกัน: วิธีการออกแบบและวิเคราะห์ GWAS, เหตุใดภาวะไม่สมดุลของการเชื่อมโยง (linkage disequilibrium) จึงทำให้การจัดเรียงแบบกระจัดกระจายสามารถระบุความแปรผันที่ไม่ได้ถูกระบุได้, เหตุใดพันธุกรรมของลักษณะส่วนใหญ่จึงดูเหมือน 'หายไป' ในตอนแรก, วิธีที่ความแตกต่างทางบรรพบุรุษสามารถสร้างความสัมพันธ์ที่ผิดพลาดได้, และวิธีที่แนวทางความแปรผันที่หายากขยายการค้นพบนอกเหนือจาก SNP ที่พบบ่อย เนื้อหานี้จัดอยู่ในหัวข้ออ้างอิงทางระเบียบวิธีวิจัยภายในจีโนมิกส์ ไม่ใช่เนื้อหาทางคลินิกเพื่อการวินิจฉัยหรือการสั่งยา
Sub-topics
Core questions
- จะทดสอบจีโนมทั้งหมดเพื่อหาความสัมพันธ์กับลักษณะได้อย่างไรโดยไม่มีการกำหนด candidate gene ล่วงหน้า?
- เหตุใดการระบุจีโนไทป์ของความแปรผันเพียงบางส่วนจึงสามารถเก็บข้อมูลเกี่ยวกับส่วนที่เหลือได้?
- เกณฑ์นัยสำคัญใดที่ควบคุมผลบวกลวงจากการทดสอบหลายล้านครั้ง?
- เหตุใดผลการค้นพบ GWAS ในยุคแรกจึงอธิบายพันธุกรรมที่ประมาณการไว้ได้เพียงเล็กน้อย?
- ความแตกต่างทางบรรพบุรุษระหว่างกลุ่มผู้ป่วยและกลุ่มควบคุมบิดเบือนสัญญาณความสัมพันธ์ได้อย่างไร?
Key concepts
- สมมติฐานโรคทั่วไป, ความแปรผันทั่วไป
- Single-nucleotide polymorphism (SNP)
- ภาวะไม่สมดุลของการเชื่อมโยงและ tag SNPs
- เกณฑ์นัยสำคัญทั่วทั้งจีโนม (~5 x 10^-8)
- การประมาณค่าจีโนไทป์จากแผงอ้างอิง
- โครงสร้างโพลียีนิกและขนาดผลกระทบ
- การแบ่งชั้นประชากร
- พันธุกรรมที่หายไป
Mechanisms
GWAS จะระบุจีโนไทป์ของแผงความแปรผันที่หนาแน่น (หรือประมาณค่าจากแผงอ้างอิงที่จัดลำดับแล้ว) และทดสอบความแปรผันแต่ละตำแหน่งเพื่อหาความสัมพันธ์ทางสถิติกับฟีโนไทป์ โดยปกติจะใช้วิธีการถดถอยที่ปรับแก้สำหรับบรรพบุรุษและตัวแปรร่วมอื่นๆ เนื่องจากความแปรผันที่อยู่ใกล้กันจะถูกถ่ายทอดร่วมกันในบล็อกของภาวะไม่สมดุลของการเชื่อมโยง เครื่องหมายที่ถูกระบุจีโนไทป์จึงสามารถทำหน้าที่เป็นตัวแทน (tag) สำหรับความแปรผันเชิงสาเหตุที่ไม่ได้ถูกระบุจีโนไทป์ได้ ดังนั้นความสัมพันธ์ที่เครื่องหมายจึงระบุตำแหน่งสัญญาณไปยังภูมิภาคหนึ่ง แทนที่จะเป็นความแปรผันเชิงสาเหตุนั้นเอง จำนวนการทดสอบที่มหาศาลจำเป็นต้องมีเกณฑ์นัยสำคัญทั่วทั้งจีโนมที่เข้มงวดเพื่อควบคุมผลบวกลวง และผลการค้นพบจะได้รับการยืนยันโดยการทำซ้ำในตัวอย่างอิสระ ความแปรผันส่วนใหญ่ที่ค้นพบนั้นพบบ่อย มีผลกระทบเล็กน้อยเป็นรายบุคคล และมักอยู่ในบริเวณควบคุมที่ไม่ใช่การเข้ารหัส ซึ่งสอดคล้องกับโครงสร้างทางพันธุกรรมที่ซับซ้อนสำหรับลักษณะที่พบบ่อย
Clinical relevance
GWAS ได้ระบุความสัมพันธ์ระหว่างความแปรผันกับลักษณะนับพันรายการที่แข็งแกร่ง ซึ่งช่วยให้เข้าใจชีววิทยาของโรค การจัดลำดับความสำคัญของเป้าหมายยา และการสร้างคะแนนโพลียีนิก ในฐานะที่เป็นพื้นที่อ้างอิง เนื้อหานี้จะอธิบายวิธีการสร้างและตีความหลักฐานทางพันธุกรรมระดับประชากร โดยจะอธิบายวิธีการและผลการค้นพบ และไม่ใช่พื้นฐานสำหรับการวินิจฉัยรายบุคคล การให้คำปรึกษาความเสี่ยง หรือการตัดสินใจในการรักษา
Epidemiology
นับตั้งแต่การศึกษาชุดแรกในช่วงปี 2005-2007 GWAS ได้ถูกนำไปใช้กับโรคและลักษณะเชิงปริมาณหลายร้อยรายการในกลุ่มประชากรตั้งแต่หลายพันถึงหลายล้านคน และคลังข้อมูลที่ได้รับการดูแลจัดการ เช่น NHGRI-EBI GWAS Catalog ได้บันทึกความสัมพันธ์หลายหมื่นรายการ ข้อจำกัดที่ยังคงมีอยู่คือผู้เข้าร่วมส่วนใหญ่มีเชื้อสายยุโรป ซึ่งจำกัดความสามารถในการถ่ายทอดผลการค้นพบและคะแนนโพลียีนิกไปยังประชากรอื่น
Evidence & guidelines
มาตรฐานระเบียบวิธีวิจัยสำหรับ GWAS ได้รับการรวบรวมผ่านความพยายามของกลุ่มความร่วมมือขนาดใหญ่และการสังเคราะห์บทวิจารณ์ แทนที่จะเป็นแนวทางปฏิบัติทางคลินิก การศึกษาของ Wellcome Trust Case Control Consortium (2007) เป็นตัวอย่างที่เป็นแบบอย่างของการออกแบบการควบคุมร่วมกันและหลายโรค และบทความวิจารณ์โดย McCarthy et al. (2008) และ Visscher et al. (2012, 2017) ได้ระบุความคาดหวังที่เป็นเอกฉันท์เกี่ยวกับเกณฑ์นัยสำคัญ การควบคุมคุณภาพ การทำซ้ำ และการตีความ
History
แนวทางนี้เป็นไปได้เมื่อแผนที่ SNP ที่หนาแน่นและโครงการ HapMap ได้ระบุลักษณะภาวะไม่สมดุลของการเชื่อมโยงทั่วทั้งจีโนม และเมื่อมีอาร์เรย์การระบุจีโนไทป์ราคาไม่แพงในช่วงกลางทศวรรษ 2000 การศึกษาของ Wellcome Trust Case Control Consortium ในปี 2007 ซึ่งทดสอบเจ็ดโรคที่พบบ่อยเทียบกับการควบคุมร่วมกัน ได้แสดงให้เห็นถึงการออกแบบในขนาดใหญ่และกระตุ้นให้เกิดการขยายตัวอย่างรวดเร็วของการทำแผนที่ความสัมพันธ์ บทวิจารณ์ต่อมาได้ติดตามการพัฒนาของสาขาจากตำแหน่งไม่กี่แห่งไปสู่แคตตาล็อกทั่วทั้งจีโนม และการรับมือกับพันธุกรรมที่หายไป ความหลากหลายของประชากร และการเคลื่อนไปสู่การศึกษาความแปรผันที่หายากและการจัดลำดับจีโนมทั้งหมด
Debates
- GWAS สามารถกู้คืนพันธุกรรมของลักษณะทั่วไปได้มากน้อยเพียงใด?
- ตำแหน่ง GWAS ในยุคแรกอธิบายพันธุกรรมที่ประมาณการไว้ได้เพียงเล็กน้อย ทำให้เกิดการถกเถียงว่าช่องว่างนี้สะท้อนถึงความแปรผันทั่วไปที่มีผลกระทบเล็กน้อยจำนวนมากที่ยังไม่ถูกตรวจพบ, ความแปรผันที่หายาก, ความแปรผันเชิงโครงสร้าง, หรือพันธุกรรมที่ประมาณการไว้สูงเกินไป; วิธีการทั่วทั้งจีโนมในภายหลังช่วยลดช่องว่างแต่ไม่ได้ปิดช่องว่างทั้งหมด
- อคติทางเชื้อสายยุโรปของ GWAS จำกัดความเท่าเทียมและความถูกต้องหรือไม่?
- เนื่องจากผู้เข้าร่วมส่วนใหญ่มีเชื้อสายยุโรป ความสัมพันธ์ที่ค้นพบและคะแนนโพลียีนิกจึงถ่ายทอดไปยังประชากรอื่นได้ไม่สมบูรณ์ ทำให้เกิดความกังวลทั้งทางวิทยาศาสตร์เกี่ยวกับความสามารถในการสรุปผล และความกังวลด้านความเท่าเทียมเกี่ยวกับผู้ที่ได้รับประโยชน์จากเวชศาสตร์จีโนมิกส์
Key figures
- Peter Visscher
- Mark McCarthy
- Joel Hirschhorn
- Naomi Wray
- Jian Yang
Related topics
Seminal works
- wtccc-2007
- mccarthy-2008
- visscher-2012
- visscher-2017
Frequently asked questions
- GWAS แตกต่างจากการศึกษา linkage อย่างไร?
- การศึกษา linkage ติดตามการถ่ายทอดร่วมกันของเครื่องหมายและโรคภายในครอบครัว และระบุบริเวณโครโมโซมกว้างๆ ในขณะที่ GWAS ทดสอบความสัมพันธ์ในบุคคลที่ไม่เกี่ยวข้องกันด้วยความละเอียดสูงทั่วทั้งจีโนม ทำให้เหมาะสำหรับความแปรผันทั่วไปที่มีผลกระทบเล็กน้อยมากกว่า
- เหตุใด GWAS จึงใช้เกณฑ์นัยสำคัญที่เข้มงวดเช่นนี้?
- เนื่องจากมีการทดสอบความแปรผันหลายล้านตำแหน่ง ค่า p-value ทั่วไปที่ 0.05 จะทำให้เกิดผลบวกลวงจำนวนมหาศาล; เกณฑ์ทั่วทั้งจีโนมที่ใกล้เคียง 5 x 10^-8 จะคำนึงถึงการทดสอบหลายครั้งที่เกี่ยวข้องกับความแปรผันทั่วไปที่เป็นอิสระทั่วทั้งจีโนม