Phân tầng quần thể và Nguồn gốc tổ tiên trong GWAS
Phân tầng quần thể là sự khác biệt có hệ thống về nguồn gốc tổ tiên giữa các cá thể được so sánh trong một nghiên cứu di truyền. Khi các trường hợp bệnh và nhóm chứng khác nhau về nền tảng tổ tiên, bất kỳ biến thể nào có tần số khác nhau giữa các nguồn gốc tổ tiên đó sẽ có vẻ liên quan đến đặc điểm ngay cả khi nó không có vai trò nhân quả - một yếu tố gây nhiễu có thể tạo ra kết quả dương tính giả trên toàn bộ bộ gen. Do đó, việc phát hiện và điều chỉnh nguồn gốc tổ tiên là một biện pháp bảo vệ cốt lõi để kiểm định mối liên hệ hợp lệ.
Definition
Phân tầng quần thể là yếu tố gây nhiễu của mối liên hệ kiểu gen-kiểu hình do sự khác biệt có hệ thống về nguồn gốc tổ tiên giữa các nhóm được so sánh, và việc kiểm soát nó là tập hợp các phương pháp - chủ yếu là các thành phần chính của nguồn gốc tổ tiên và các mô hình hỗn hợp - điều chỉnh các kiểm định mối liên hệ để các tín hiệu phản ánh các hiệu ứng trong cùng một nguồn gốc tổ tiên chứ không phải bản thân nguồn gốc tổ tiên.
Scope
Chủ đề này bao gồm lý do tại sao sự khác biệt về nguồn gốc tổ tiên gây nhiễu các kiểm định mối liên hệ, cách phát hiện phân tầng (lạm phát bộ gen, phân tích thành phần chính), cách điều chỉnh (biến đồng phương sai thành phần chính, mô hình hỗn hợp, kiểm soát bộ gen), và mối quan tâm rộng hơn về sự công bằng rằng sự thiên lệch về nguồn gốc tổ tiên châu Âu của GWAS hạn chế khả năng chuyển giao của các phát hiện và điểm đa gen. Đây là tài liệu tham khảo về phương pháp, không phải hướng dẫn lâm sàng.
Core questions
- Sự khác biệt về nguồn gốc tổ tiên giữa các trường hợp bệnh và nhóm chứng tạo ra các mối liên hệ giả như thế nào?
- Phân tầng được phát hiện như thế nào, và yếu tố kiểm soát bộ gen bị lạm phát cho thấy điều gì?
- Phân tích thành phần chính điều chỉnh nguồn gốc tổ tiên như thế nào?
- Khi nào các mô hình hỗn hợp được ưu tiên để xử lý cấu trúc và mối quan hệ?
- Tại sao sự thiên lệch về nguồn gốc tổ tiên châu Âu của GWAS hạn chế khả năng khái quát hóa?
Key concepts
- Gây nhiễu bởi nguồn gốc tổ tiên
- Kiểm soát bộ gen và yếu tố lạm phát (lambda)
- Phân tích thành phần chính của kiểu gen
- Các dấu hiệu thông tin về nguồn gốc tổ tiên
- Các mô hình hỗn hợp tuyến tính cho cấu trúc và mối quan hệ
- Hỗn huyết và nguồn gốc tổ tiên liên tục
- Khả năng chuyển giao của các phát hiện và điểm đa gen giữa các nguồn gốc tổ tiên
Mechanisms
Nếu các nhóm phụ có nguồn gốc tổ tiên khác nhau được đại diện không đồng đều giữa các trường hợp bệnh và nhóm chứng, và nếu cả nguy cơ bệnh và tần số alen khác nhau giữa các nhóm phụ đó, tần số alen sẽ theo dõi đặc điểm thông qua nguồn gốc tổ tiên chứ không phải nguyên nhân, làm tăng thống kê kiểm định trên toàn bộ bộ gen. Việc phát hiện dựa vào dấu hiệu trên toàn bộ bộ gen này: yếu tố lạm phát kiểm soát bộ gen tóm tắt mức độ thống kê kiểm định trung vị vượt quá kỳ vọng rỗng của nó, và phân tích thành phần chính của kiểu gen trên toàn bộ bộ gen cho thấy các trục biến đổi nguồn gốc tổ tiên giữa các mẫu. Việc điều chỉnh thường bao gồm các thành phần chính hàng đầu làm biến đồng phương sai trong hồi quy, hấp thụ tín hiệu nguồn gốc tổ tiên, hoặc sử dụng các mô hình hỗn hợp tuyến tính đồng thời tính đến cấu trúc và mối quan hệ ẩn thông qua ma trận quan hệ di truyền. Các bảng tham chiếu như Dự án 1000 Bộ gen giúp đặt các mẫu vào bản đồ nguồn gốc tổ tiên toàn cầu và cung cấp thông tin cho việc nội suy. Bởi vì hầu hết các mẫu GWAS có nguồn gốc tổ tiên châu Âu, ngay cả các phân tích được điều chỉnh tốt cũng cho ra các ước tính hiệu ứng và điểm đa gen chuyển giao không hoàn hảo sang các quần thể khác.
Clinical relevance
Việc điều chỉnh nguồn gốc tổ tiên là cần thiết cho tính hợp lệ của bằng chứng di truyền được sử dụng trong nghiên cứu bệnh, và thành phần nguồn gốc tổ tiên của các nghiên cứu ảnh hưởng trực tiếp đến sinh học của ai được đại diện trong các phát hiện và điểm số bộ gen. Chủ đề này mô tả các phương pháp và cân nhắc về sự công bằng; nó không phải là cơ sở để xét nghiệm di truyền cá nhân hoặc giải thích lâm sàng.
Evidence & guidelines
Các tiêu chuẩn ở đây đến từ tài liệu phương pháp luận chứ không phải hướng dẫn lâm sàng. Price et al. (2006) đã giới thiệu điều chỉnh thành phần chính (phương pháp EIGENSTRAT) như một giải pháp có thể mở rộng; Price et al. (2010) đã xem xét và mở rộng các chiến lược bao gồm các mô hình hỗn hợp; Dự án 1000 Bộ gen (2015) đã cung cấp tài liệu tham khảo đa dạng cần thiết để mô tả nguồn gốc tổ tiên; và Visscher et al. (2017) nhấn mạnh các hậu quả về khả năng khái quát hóa và sự công bằng của sự mất cân bằng nguồn gốc tổ tiên.
History
Mối lo ngại rằng nguồn gốc tổ tiên có thể gây nhiễu mối liên hệ di truyền đã có từ trước GWAS, và các phương pháp ban đầu như kiểm soát bộ gen và liên kết có cấu trúc đã được phát triển để giải quyết vấn đề này. Việc giới thiệu phân tích thành phần chính vào năm 2006 đã cung cấp một cách nhanh chóng, trên toàn bộ bộ gen để mô hình hóa nguồn gốc tổ tiên liên tục và trở thành thực hành tiêu chuẩn, sau đó được bổ sung bởi các phương pháp mô hình hỗn hợp cũng xử lý mối quan hệ. Khi GWAS mở rộng thành các ngân hàng sinh học, lĩnh vực này ngày càng nhận ra rằng việc kiểm soát phân tầng trong các mẫu chủ yếu là người châu Âu không giải quyết được vấn đề lớn hơn về sự thiếu đại diện của các nguồn gốc tổ tiên khác.
Debates
- Các điều chỉnh nguồn gốc tổ tiên có loại bỏ hoàn toàn yếu tố gây nhiễu không, hay chúng cũng có thể loại bỏ tín hiệu thực?
- Các thành phần chính và mô hình hỗn hợp kiểm soát phân tầng hiệu quả trong hầu hết các trường hợp, nhưng việc phân biệt yếu tố gây nhiễu với sinh học thực sự tương quan với nguồn gốc tổ tiên - và tránh điều chỉnh quá mức làm mất đi các hiệu ứng thực - vẫn là một phán đoán về phương pháp luận, đặc biệt đối với các đặc điểm có cấu trúc địa lý tinh tế.
- Sự thiên lệch về nguồn gốc tổ tiên châu Âu của GWAS có làm suy yếu sự công bằng và tính hợp lệ không?
- Các phát hiện và điểm đa gen chủ yếu từ các mẫu có nguồn gốc tổ tiên châu Âu chuyển giao không hoàn hảo sang các quần thể khác, làm dấy lên những lo ngại khoa học về khả năng khái quát hóa và những lo ngại về sự công bằng liên quan đến việc phân phối lợi ích của y học bộ gen.
Key figures
- Alkes Price
- David Reich
- Nick Patterson
- Noah Zaitlen
- Peter Visscher
Related topics
Seminal works
- price-2006
- price-2010
Frequently asked questions
- Phân tầng quần thể tạo ra kết quả GWAS sai lệch như thế nào?
- Nếu các trường hợp bệnh và nhóm chứng khác nhau về nguồn gốc tổ tiên, các biến thể có tần số khác nhau giữa các nguồn gốc tổ tiên đó sẽ xuất hiện liên quan đến đặc điểm thông qua nguồn gốc tổ tiên chứ không phải nguyên nhân, tạo ra các mối liên hệ giả trên toàn bộ bộ gen.
- Phân tầng thường được điều chỉnh như thế nào?
- Cách tiếp cận tiêu chuẩn bao gồm các thành phần chính hàng đầu của kiểu gen trên toàn bộ bộ gen làm biến đồng phương sai, hoặc sử dụng mô hình hỗn hợp tuyến tính, để các kiểm định mối liên hệ phản ánh các hiệu ứng trong cùng một nguồn gốc tổ tiên chứ không phải bản thân sự khác biệt về nguồn gốc tổ tiên.