การแบ่งชั้นประชากรและการผสมผสานทางพันธุกรรม
การแบ่งชั้นประชากร (population stratification) คือการมีความแตกต่างอย่างเป็นระบบในบรรพบุรุษทางพันธุกรรมระหว่างกลุ่มที่นำมาเปรียบเทียบในการศึกษาทางพันธุกรรม และการผสมผสานทางพันธุกรรม (admixture) คือการผสมผสานบรรพบุรุษภายในแต่ละบุคคลจากประชากรที่เคยแยกจากกันมาก่อน ทั้งสองสิ่งนี้สร้างโครงสร้างประชากรที่อาจทำให้การศึกษาความสัมพันธ์ทางพันธุกรรมเกิดความสับสน โดยสร้างความเชื่อมโยงที่ผิดพลาดระหว่างตัวแปรกับโรค เพียงเพราะความถี่ของอัลลีลและความเสี่ยงของโรคแตกต่างกันตามบรรพบุรุษ
Definition
การแบ่งชั้นประชากร (Population stratification) คือความสับสนในการศึกษาความสัมพันธ์ทางพันธุกรรมที่เกิดจากความแตกต่างของบรรพบุรุษระหว่างกลุ่ม ซึ่งความถี่ของอัลลีลและความเสี่ยงของโรคแตกต่างกันไปในประชากรย่อย และการผสมผสานทางพันธุกรรม (admixture) คือการมีบรรพบุรุษทางพันธุกรรมจากประชากรที่แตกต่างกันทางประวัติศาสตร์ตั้งแต่สองกลุ่มขึ้นไปภายในแต่ละบุคคล ซึ่งเป็นแหล่งที่มาของโครงสร้างที่เกี่ยวข้อง
Scope
หัวข้อนี้ครอบคลุมถึงวิธีการที่โครงสร้างประชากรเกิดขึ้น เหตุใดจึงทำให้การศึกษาความสัมพันธ์ทางพันธุกรรมแบบควบคุมกรณี (case-control) เกิดความสับสน และวิธีการหลักที่ใช้ในการตรวจจับและปรับแก้ปัญหานี้ โดยนำเสนอในฐานะหัวข้อระเบียบวิธีวิจัยในระบาดวิทยาพันธุกรรม ซึ่งเกี่ยวข้องกับความถูกต้องของการศึกษา และไม่ใช่เป็นการกล่าวถึงชีววิทยาหรือการจัดลำดับกลุ่มประชากรมนุษย์
Core questions
- กลุ่มที่นำมาเปรียบเทียบในการศึกษาทางพันธุกรรมมาจากประชากรพื้นฐานเดียวกันหรือไม่?
- ความสัมพันธ์ระหว่างตัวแปรกับโรคที่ปรากฏขึ้นนั้นสามารถอธิบายได้ด้วยบรรพบุรุษมากกว่าสาเหตุหรือไม่?
- จะตรวจจับโครงสร้างประชากรจากข้อมูลทางพันธุกรรมได้อย่างไร?
- จะปรับการทดสอบความสัมพันธ์ได้อย่างไรเพื่อไม่ให้โครงสร้างประชากรเพิ่มผลบวกปลอม?
Key concepts
- ความสับสนจากบรรพบุรุษ
- โครงสร้างและโครงสร้างย่อยของประชากร
- การผสมผสานทางพันธุกรรม
- ความแตกต่างของความถี่อัลลีล
- การควบคุมทางจีโนม
- การวิเคราะห์องค์ประกอบหลักของบรรพบุรุษ
- แบบจำลองผสมสำหรับความสัมพันธ์
Mechanisms
หากกลุ่มผู้ป่วยและกลุ่มควบคุมในการศึกษาความสัมพันธ์มีความแตกต่างกันทางบรรพบุรุษ ตัวแปรใดๆ ที่มีความถี่แตกต่างกันระหว่างกลุ่มบรรพบุรุษเหล่านั้นจะปรากฏว่ามีความสัมพันธ์กับโรค เมื่อความเสี่ยงของโรคก็แตกต่างกันระหว่างกลุ่มเหล่านั้นด้วย แม้ว่าตัวแปรนั้นจะไม่มีบทบาทเชิงสาเหตุเลยก็ตาม นี่คือความสับสนแบบคลาสสิก โดยมีบรรพบุรุษทางพันธุกรรมเป็นตัวแปรสับสน วิธีการแก้ไขปัญหานี้ทำได้โดยการวัดและปรับแก้บรรพบุรุษ: การควบคุมทางจีโนม (genomic control) จะปรับขนาดสถิติการทดสอบโดยใช้ปัจจัยเงินเฟ้อที่ประมาณจากเครื่องหมายจำนวนมาก; การวิเคราะห์องค์ประกอบหลัก (principal components analysis) จะสรุปบรรพบุรุษจากจีโนไทป์ทั่วทั้งจีโนมและรวมองค์ประกอบเหล่านั้นเป็นตัวแปรร่วม; และแบบจำลองผสม (mixed models) จะพิจารณาทั้งโครงสร้างกว้างๆ และความสัมพันธ์ที่ซ่อนอยู่ การผสมผสานทางพันธุกรรม (admixture) ซึ่งแต่ละบุคคลมีบรรพบุรุษผสมกัน สามารถจัดการได้ด้วยวิธีการที่เกี่ยวข้องซึ่งประมาณบรรพบุรุษในระดับท้องถิ่นหรือระดับโลก
Clinical relevance
การควบคุมโครงสร้างประชากรเป็นสิ่งจำเป็นต่อความถูกต้องของหลักฐานความสัมพันธ์ทางพันธุกรรมที่ใช้ในการทำความเข้าใจความเสี่ยงของโรคเรื้อรัง เนื่องจากหากไม่มีการควบคุมการแบ่งชั้นประชากร อาจทำให้เกิดความสัมพันธ์ที่ผิดพลาดซึ่งนำไปสู่การวิจัยในภายหลังที่คลาดเคลื่อน ในฐานะหัวข้ออ้างอิง บทความนี้อธิบายถึงภัยคุกคามต่อความถูกต้องของการศึกษาและวิธีการแก้ไขปัญหาดังกล่าว แต่ไม่ได้ให้คำแนะนำสำหรับการทดสอบหรือการตีความทางพันธุกรรมรายบุคคล
Epidemiology
ความกังวลเกี่ยวกับการแบ่งชั้นประชากรเพิ่มขึ้นเมื่อการศึกษาความสัมพันธ์ทางพันธุกรรมขยายขนาดขึ้น เนื่องจากความแตกต่างของบรรพบุรุษเพียงเล็กน้อยระหว่างกลุ่มผู้ป่วยและกลุ่มควบคุมก็สามารถเพิ่มอัตราการเกิดผลบวกปลอมในตัวแปรจำนวนมากที่ทดสอบในการศึกษาทั่วทั้งจีโนมได้ การพัฒนาการควบคุมทางจีโนม และต่อมาคือการปรับแก้ด้วยองค์ประกอบหลักและแบบจำลองผสม ทำให้การศึกษาความสัมพันธ์ขนาดใหญ่ที่มีบรรพบุรุษหลากหลายเป็นไปได้ ในขณะที่ยังคงควบคุมอัตราการเกิดผลบวกปลอมไว้ได้
History
ความตระหนักว่าบรรพบุรุษอาจทำให้การศึกษาความสัมพันธ์เกิดความสับสนมีมาก่อนยุคจีโนมิกส์ แต่แนวทางแก้ไขที่เป็นรูปธรรมปรากฏขึ้นในช่วงปลายทศวรรษ 1990 และ 2000 Pritchard และ Rosenberg เสนอให้ใช้เครื่องหมายที่ไม่เชื่อมโยงกันเพื่อตรวจจับการแบ่งชั้นประชากร Devlin และ Roeder นำเสนอการควบคุมทางจีโนมเพื่อแก้ไขสถิติการทดสอบที่สูงเกินจริง และ Price และคณะแสดงให้เห็นในปี 2006 ว่าการวิเคราะห์องค์ประกอบหลักสามารถแก้ไขการแบ่งชั้นประชากรในการศึกษาความสัมพันธ์ทั่วทั้งจีโนมได้อย่างมีประสิทธิภาพ ซึ่งเป็นแนวทางที่กลายเป็นมาตรฐานปฏิบัติ
Debates
- การปรับแก้ทางสถิติสามารถขจัดความสับสนจากบรรพบุรุษได้อย่างสมบูรณ์เพียงใด?
- การควบคุมทางจีโนม องค์ประกอบหลัก และแบบจำลองผสมช่วยลดการเพิ่มขึ้นจากโครงสร้างประชากร แต่ยังคงมีการถกเถียงกันเกี่ยวกับความสับสนที่หลงเหลืออยู่จากโครงสร้างขนาดเล็กหรือโครงสร้างล่าสุด และเกี่ยวกับประสิทธิภาพของการแก้ไขเหล่านี้ในการถ่ายทอดข้ามประชากรที่หลากหลายและมีการผสมผสานทางพันธุกรรม
Key figures
- Jonathan Pritchard
- Noah Rosenberg
- Bernie Devlin
- Kathryn Roeder
- Alkes Price
- David Reich
Related topics
Seminal works
- pritchard-rosenberg-1999
- devlin-roeder-1999
- price-2006
Frequently asked questions
- เหตุใดการแบ่งชั้นประชากรจึงทำให้เกิดความสัมพันธ์ที่ผิดพลาด?
- เมื่อกลุ่มผู้ป่วยและกลุ่มควบคุมมีความแตกต่างกันทางบรรพบุรุษ ตัวแปรที่แตกต่างกันเพียงแค่ความถี่ระหว่างกลุ่มบรรพบุรุษก็อาจดูเหมือนมีความสัมพันธ์กับโรค เมื่อความเสี่ยงของโรคก็แตกต่างกันตามบรรพบุรุษ ดังนั้นความสัมพันธ์ดังกล่าวจึงสะท้อนถึงความสับสนจากบรรพบุรุษมากกว่าผลกระทบเชิงสาเหตุของตัวแปรนั้น
- การศึกษาในปัจจุบันแก้ไขโครงสร้างประชากรอย่างไร?
- แนวทางปฏิบัติทั่วไปคือการประมาณบรรพบุรุษจากข้อมูลทั่วทั้งจีโนมและปรับแก้สำหรับสิ่งนั้น ตัวอย่างเช่น โดยการรวมองค์ประกอบหลักของบรรพบุรุษเป็นตัวแปรร่วม การใช้การควบคุมทางจีโนมเพื่อปรับขนาดสถิติการทดสอบ หรือการใช้แบบจำลองผสมที่พิจารณาความสัมพันธ์และโครงสร้าง