ภาวะไม่สมดุลของการเชื่อมโยงช่วยให้ GWAS ระบุได้เพียงบางตัวแปรได้อย่างไร?

เนื่องจากตัวแปรในบล็อกแฮปโลไทป์มีความสัมพันธ์กันอย่างมาก แท็ก SNP ที่ระบุจีโนไทป์จึงมีข้อมูลเกี่ยวกับตัวแปรใกล้เคียงที่ไม่ได้ระบุ ดังนั้นอาร์เรย์ของแท็กที่เลือกมาอย่างดีจึงสามารถจับความหลากหลายทั่วไปส่วนใหญ่ในจีโนมได้

D' และ r-squared แตกต่างกันอย่างไร?

D' วัดว่ามีการรวมกลุ่มใหม่แยกอัลลีลสองตัวในอดีตหรือไม่ ในขณะที่ r-squared วัดว่าตัวแปรหนึ่งสามารถทำนายตัวแปรอื่นได้ดีเพียงใดในเชิงสถิติ r-squared เป็นปริมาณที่เกี่ยวข้องมากที่สุดกับพลังของการทดสอบความสัมพันธ์โดยใช้แท็ก SNP

ภาวะไม่สมดุลของการเชื่อมโยง (Linkage Disequilibrium) และ SNP Tagging

ภาวะไม่สมดุลของการเชื่อมโยง (Linkage disequilibrium หรือ LD) คือการเกิดร่วมกันของอัลลีลในตำแหน่งต่างๆ บนจีโนมที่ไม่เป็นไปโดยสุ่ม: ตัวแปรที่อยู่ใกล้กันมักจะถูกถ่ายทอดร่วมกันเป็นบล็อกของแฮปโลไทป์ ความสัมพันธ์นี้เองที่ทำให้การศึกษาความสัมพันธ์ทั่วทั้งจีโนม (genome-wide association studies) มีราคาไม่แพง – อาร์เรย์การหาจีโนไทป์จำเป็นต้องระบุเพียงชุดย่อยของ 'แท็ก' SNP ที่เลือกมาอย่างระมัดระวังเท่านั้น เนื่องจากแท็กแต่ละตัวสามารถใช้แทนตัวแปรที่ไม่ได้ระบุซึ่งมีความสัมพันธ์แบบ LD ที่แข็งแกร่งได้ในเชิงสถิติ

ค้นหาหัวข้อด้วย PaperMindเร็ว ๆ นี้Find papers & topics

Tools & resources

ดาวน์โหลดสไลด์

Learn & explore

วิดีโอเร็ว ๆ นี้

Definition

ภาวะไม่สมดุลของการเชื่อมโยงคือความสัมพันธ์ทางสถิติระหว่างอัลลีลในสองตำแหน่งหรือมากกว่านั้น – การเกิดร่วมกันบนแฮปโลไทป์ที่บ่อยกว่าหรือน้อยกว่าที่คาดไว้หากเป็นอิสระ – และ SNP tagging คือการใช้ชุดย่อยของตัวแปรที่ผ่าน LD สามารถจับความหลากหลายของตำแหน่งใกล้เคียงที่ไม่ได้ระบุได้

Scope

หัวข้อนี้อธิบายว่า LD คืออะไร วัดได้อย่างไร (D' และ r-squared) ทำไมจึงเกิดเป็นบล็อกที่ถูกกำหนดโดยการรวมกลุ่มใหม่และประวัติประชากร วิธีการเลือกแท็ก SNP เพื่อจับความหลากหลายทั่วไปได้อย่างมีประสิทธิภาพ และ LD ทั้งช่วยให้สามารถทำแผนที่ความสัมพันธ์และทำให้การระบุตำแหน่งของตัวแปรที่เป็นสาเหตุซับซ้อนขึ้น เป็นข้อมูลอ้างอิงทางระเบียบวิธีวิจัย ไม่ใช่แนวทางปฏิบัติทางคลินิก

Core questions

การที่ตัวแปรสองตัวอยู่ในภาวะไม่สมดุลของการเชื่อมโยงหมายความว่าอย่างไร?
D' และ r-squared ถูกนำมาใช้ในการหาปริมาณ LD อย่างไร และแตกต่างกันอย่างไร?
ทำไมจีโนมจึงแบ่งออกเป็นบล็อกแฮปโลไทป์ และอะไรเป็นตัวกำหนดขอบเขตของบล็อกเหล่านั้น?
แท็ก SNP ถูกเลือกอย่างไรเพื่อให้อาร์เรย์สามารถจับความหลากหลายทั่วไปส่วนใหญ่ได้?
ทำไม LD จึงทำให้การระบุตัวแปรที่เป็นสาเหตุที่แท้จริงภายในภูมิภาคที่เกี่ยวข้องเป็นเรื่องยาก?

Key concepts

แฮปโลไทป์และบล็อกแฮปโลไทป์
D' (สัมประสิทธิ์ภาวะไม่สมดุลแบบมาตรฐาน)
r-squared (ความสัมพันธ์ระหว่างเครื่องหมาย)
จุดรวมกลุ่มใหม่ (Recombination hotspots)
การเลือกแท็ก SNP
แผงแฮปโลไทป์อ้างอิง (HapMap, 1000 Genomes)
การทำแผนที่ละเอียดและการคลุมเครือของตัวแปรที่เป็นสาเหตุ

Mechanisms

อัลลีลในตำแหน่งใกล้เคียงกันจะถูกถ่ายทอดร่วมกันจนกว่าการรวมกลุ่มใหม่จะแยกพวกมันออกจากกัน ดังนั้นเมื่อผ่านไปหลายชั่วอายุคน LD จะลดลงตามระยะทางทางพันธุกรรมและถูกทำลายลงที่จุดรวมกลุ่มใหม่ (recombination hotspots) ทำให้เกิดบล็อกที่มีความสัมพันธ์ภายในสูง มีสองมาตรวัดทั่วไปที่ใช้ในการหาปริมาณ: D' วัดว่ามีการรวมกลุ่มใหม่เกิดขึ้นระหว่างสองตำแหน่งหรือไม่ ในขณะที่ r-squared วัดว่าตัวแปรหนึ่งสามารถทำนายตัวแปรอื่นได้ดีเพียงใด และควบคุมโดยตรงถึงพลังที่สูญเสียไปเมื่อแท็ก SNP เป็นตัวแทนของตัวแปรที่เป็นสาเหตุที่ไม่ได้ระบุ เนื่องจากตัวแปรภายในบล็อกมีความสัมพันธ์กันอย่างมาก อาร์เรย์สามารถหาจีโนไทป์ชุดของแท็ก SNP ที่เลือกไว้และกู้คืนความหลากหลายทั่วไปส่วนใหญ่ได้ และตัวแปรที่ขาดหายไปสามารถถูกประมาณค่าทางสถิติได้โดยใช้แผงอ้างอิงที่จัดลำดับเช่น HapMap และ 1000 Genomes Project ความสัมพันธ์เดียวกันที่ช่วยให้การทำแท็กเป็นไปได้ยังหมายความว่าสัญญาณความสัมพันธ์จะถูกแบ่งปันในหลายตัวแปรในบล็อก ดังนั้นการระบุตัวแปรที่เป็นสาเหตุที่แท้จริงจึงต้องใช้การทำแผนที่ละเอียดเพิ่มเติม แทนที่จะเพียงแค่เลือกเครื่องหมายที่มีนัยสำคัญที่สุด

Clinical relevance

โครงสร้าง LD เป็นพื้นฐานว่าหลักฐานทางพันธุกรรมทั่วทั้งจีโนมถูกสร้างขึ้นอย่างไร และภูมิภาคความสัมพันธ์ถูกตีความอย่างไรในการวิจัยโรค หัวข้อนี้เป็นการอธิบายระเบียบวิธีและพันธุศาสตร์ประชากร ไม่ใช่พื้นฐานสำหรับการทดสอบทางพันธุกรรมส่วนบุคคลหรือการตีความทางคลินิก

Evidence & guidelines

ความรู้เกี่ยวกับโครงสร้าง LD ของมนุษย์อาศัยแหล่งข้อมูลอ้างอิงขนาดใหญ่มากกว่าแนวทางปฏิบัติทางคลินิก โครงการ International HapMap Project (2007) ได้ทำแผนที่ LD ทั่วทั้งจีโนมและแท็ก SNP โครงการ 1000 Genomes Project (2015) ได้ขยายแฮปโลไทป์อ้างอิงในประชากรที่หลากหลาย และบทวิจารณ์เช่น Slatkin (2008) และ Bush and Moore (2012) อธิบายว่ามาตรวัด LD และการทำแท็กถูกนำไปใช้ในการทำแผนที่ความสัมพันธ์อย่างไร

History

แนวคิดของความสัมพันธ์ของอัลลีลมีมาก่อนยุคจีโนมิกส์ แต่ความสำคัญในทางปฏิบัติเพิ่มขึ้นเมื่อมีการค้นพบในช่วงต้นทศวรรษ 2000 ว่าจีโนมของมนุษย์มีโครงสร้างแฮปโลไทป์แบบบล็อกที่ถูกกำหนดโดยจุดรวมกลุ่มใหม่ โครงการ HapMap ได้จัดทำรายการ LD ทั่วทั้งจีโนมและทำให้การเลือกแท็ก SNP เป็นไปได้ ซึ่งช่วยให้สามารถสร้างอาร์เรย์ GWAS ที่มีราคาไม่แพงได้เป็นครั้งแรก ต่อมาโครงการ 1000 Genomes Project ได้ขยายแผงอ้างอิงไปยังประชากรจำนวนมาก ปรับปรุงการประมาณค่าและเปิดเผยว่ารูปแบบ LD แตกต่างกันไปตามเชื้อชาติอย่างไร

Debates

รูปแบบ LD สามารถถ่ายทอดข้ามประชากรได้หรือไม่?: โครงสร้างแฮปโลไทป์และ LD แตกต่างกันไปตามประวัติประชากร ดังนั้นแท็ก SNP และแผงการประมาณค่าที่ปรับให้เหมาะสมในเชื้อชาติหนึ่งจึงจับความหลากหลายได้ไม่สมบูรณ์ในเชื้อชาติอื่น ซึ่งมีส่วนทำให้ประสิทธิภาพของอาร์เรย์และคะแนนที่ได้จากประชากรยุโรปลดลงในประชากรอื่น

Key figures

Montgomery Slatkin
Mark Daly
David Altshuler
Goncalo Abecasis
William Bush

Seminal works

slatkin-2008
hapmap-2007
1000g-2015

Frequently asked questions

ภาวะไม่สมดุลของการเชื่อมโยงช่วยให้ GWAS ระบุได้เพียงบางตัวแปรได้อย่างไร?: เนื่องจากตัวแปรในบล็อกแฮปโลไทป์มีความสัมพันธ์กันอย่างมาก แท็ก SNP ที่ระบุจีโนไทป์จึงมีข้อมูลเกี่ยวกับตัวแปรใกล้เคียงที่ไม่ได้ระบุ ดังนั้นอาร์เรย์ของแท็กที่เลือกมาอย่างดีจึงสามารถจับความหลากหลายทั่วไปส่วนใหญ่ในจีโนมได้
D' และ r-squared แตกต่างกันอย่างไร?: D' วัดว่ามีการรวมกลุ่มใหม่แยกอัลลีลสองตัวในอดีตหรือไม่ ในขณะที่ r-squared วัดว่าตัวแปรหนึ่งสามารถทำนายตัวแปรอื่นได้ดีเพียงใดในเชิงสถิติ r-squared เป็นปริมาณที่เกี่ยวข้องมากที่สุดกับพลังของการทดสอบความสัมพันธ์โดยใช้แท็ก SNP