Nghiên cứu liên kết trên toàn bộ hệ gen và khám phá biến thể
Nghiên cứu liên kết trên toàn bộ hệ gen (GWAS) quét hàng trăm nghìn đến hàng triệu biến thể di truyền trên hệ gen của nhiều cá thể để tìm ra các vị trí mà tần số alen khác biệt một cách có hệ thống giữa những người có và không có một đặc điểm hoặc bệnh. Bằng cách kiểm tra toàn bộ hệ gen mà không có giả thuyết ban đầu về gen nào liên quan, GWAS đã biến việc tìm kiếm cơ sở di truyền của các tình trạng phổ biến, phức tạp từ một trò chơi đoán gen ứng cử viên thành một công cuộc khám phá có hệ thống, không dựa trên giả thuyết.
Definition
Nghiên cứu liên kết trên toàn bộ hệ gen là một nghiên cứu di truyền quan sát kiểm tra mối liên hệ giữa kiểu hình và các biến thể di truyền – điển hình là các đa hình đơn nucleotide – được định kiểu gen hoặc suy luận trên toàn bộ hệ gen, công bố mối liên hệ tại các biến thể có bằng chứng thống kê vượt qua ngưỡng ý nghĩa trên toàn bộ hệ gen.
Scope
Lĩnh vực này định hướng người đọc đến nhóm các phương pháp và khái niệm xoay quanh việc khám phá biến thể trong các quần thể không liên quan: cách GWAS được thiết kế và phân tích, tại sao mất cân bằng liên kết cho phép một mảng thưa thớt gắn thẻ các biến thể không được định kiểu, tại sao phần lớn tính di truyền của đặc điểm ban đầu dường như 'thiếu', cách sự khác biệt về tổ tiên có thể tạo ra các liên kết giả, và cách các phương pháp biến thể hiếm mở rộng khám phá vượt ra ngoài các SNP phổ biến. Nó coi đây là các chủ đề tham khảo về phương pháp luận trong bộ gen học, không phải là nội dung lâm sàng chẩn đoán hoặc kê đơn.
Sub-topics
Core questions
- Làm thế nào có thể kiểm tra toàn bộ hệ gen về mối liên hệ với một đặc điểm mà không có gen ứng cử viên nào trước đó?
- Tại sao việc định kiểu gen một phần nhỏ các biến thể lại thu thập thông tin về phần còn lại?
- Ngưỡng ý nghĩa nào kiểm soát các dương tính giả trên hàng triệu thử nghiệm?
- Tại sao các phát hiện GWAS ban đầu chỉ giải thích một phần nhỏ tính di truyền ước tính?
- Sự khác biệt về tổ tiên giữa các trường hợp và nhóm chứng làm sai lệch tín hiệu liên kết như thế nào?
Key concepts
- Giả thuyết bệnh phổ biến, biến thể phổ biến
- Đa hình đơn nucleotide (SNP)
- Mất cân bằng liên kết và SNP thẻ
- Ngưỡng ý nghĩa trên toàn bộ hệ gen (~5 x 10^-8)
- Suy luận kiểu gen từ các bảng tham chiếu
- Kiến trúc đa gen và kích thước hiệu ứng
- Phân tầng quần thể
- Tính di truyền bị thiếu
Mechanisms
Một GWAS định kiểu gen một bảng dày đặc các biến thể (hoặc suy luận chúng dựa trên một bảng tham chiếu đã được giải trình tự) và kiểm tra từng biến thể về mối liên hệ thống kê với kiểu hình, thường thông qua hồi quy điều chỉnh theo tổ tiên và các biến đồng biến khác. Bởi vì các biến thể gần nhau được di truyền cùng nhau trong các khối mất cân bằng liên kết, một dấu hiệu đã được định kiểu có thể hoạt động như một đại diện (thẻ) cho các biến thể gây bệnh không được định kiểu, do đó mối liên hệ tại một dấu hiệu định vị tín hiệu đến một vùng chứ không nhất thiết là đến chính biến thể gây bệnh. Số lượng thử nghiệm khổng lồ đòi hỏi một ngưỡng ý nghĩa trên toàn bộ hệ gen nghiêm ngặt để kiểm soát các dương tính giả, và các phát hiện được xác nhận bằng cách nhân rộng trong các mẫu độc lập. Hầu hết các biến thể được phát hiện là phổ biến, có tác động nhỏ riêng lẻ và thường nằm trong các vùng điều hòa không mã hóa, phù hợp với kiến trúc đa gen cao cho các đặc điểm phổ biến.
Clinical relevance
GWAS đã lập bản đồ hàng nghìn mối liên hệ biến thể-đặc điểm mạnh mẽ giúp hiểu biết về sinh học bệnh, ưu tiên mục tiêu thuốc và xây dựng điểm đa gen. Là một lĩnh vực tham khảo, nó giải thích cách bằng chứng di truyền quy mô quần thể được tạo ra và diễn giải; nó mô tả các phương pháp và phát hiện và không phải là cơ sở để chẩn đoán cá nhân, tư vấn rủi ro hoặc quyết định điều trị.
Epidemiology
Kể từ làn sóng nghiên cứu đầu tiên vào khoảng năm 2005-2007, GWAS đã được áp dụng cho hàng trăm bệnh và đặc điểm định lượng trong các đoàn hệ từ hàng nghìn đến hàng triệu người tham gia, và các kho lưu trữ được quản lý như NHGRI-EBI GWAS Catalog hiện ghi lại hàng chục nghìn mối liên hệ. Một hạn chế dai dẳng là phần lớn người tham gia có tổ tiên châu Âu, điều này hạn chế khả năng chuyển giao các phát hiện và điểm đa gen sang các quần thể khác.
Evidence & guidelines
Các tiêu chuẩn phương pháp luận cho GWAS đã được củng cố thông qua các nỗ lực của các tập đoàn lớn và tổng hợp đánh giá hơn là các hướng dẫn thực hành lâm sàng. Nghiên cứu của Wellcome Trust Case Control Consortium (2007) là một minh chứng điển hình về thiết kế kiểm soát chung, đa bệnh, và các bài đánh giá của McCarthy et al. (2008) và Visscher et al. (2012, 2017) trình bày các kỳ vọng đồng thuận về ngưỡng ý nghĩa, kiểm soát chất lượng, nhân rộng và diễn giải.
History
Phương pháp này trở nên khả thi khi các bản đồ SNP dày đặc và dự án HapMap đã mô tả đặc điểm mất cân bằng liên kết trên toàn bộ hệ gen, và khi các mảng định kiểu gen giá cả phải chăng xuất hiện vào giữa những năm 2000. Nghiên cứu của Wellcome Trust Case Control Consortium năm 2007, kiểm tra bảy bệnh phổ biến so với các kiểm soát chung, đã chứng minh thiết kế ở quy mô lớn và thúc đẩy sự mở rộng nhanh chóng của việc lập bản đồ liên kết. Các đánh giá tiếp theo đã theo dõi sự trưởng thành của lĩnh vực này từ một số ít locus đến các danh mục trên toàn bộ hệ gen, và việc giải quyết tính di truyền bị thiếu, sự đa dạng quần thể và việc chuyển sang các nghiên cứu biến thể hiếm và giải trình tự toàn bộ hệ gen.
Debates
- GWAS có thể phục hồi bao nhiêu phần trăm tính di truyền của đặc điểm phổ biến?
- Các locus GWAS ban đầu chỉ giải thích một phần nhỏ tính di truyền ước tính, gây ra tranh luận về việc liệu khoảng cách này phản ánh nhiều biến thể phổ biến có tác động nhỏ không được phát hiện, các biến thể hiếm, biến đổi cấu trúc, hay tính di truyền bị ước tính quá cao; các phương pháp toàn bộ hệ gen sau này đã thu hẹp nhưng không đóng lại khoảng cách này.
- Liệu sự thiên vị tổ tiên châu Âu trong GWAS có hạn chế sự công bằng và tính hợp lệ không?
- Vì hầu hết những người tham gia có tổ tiên châu Âu, các mối liên hệ được phát hiện và điểm đa gen chuyển giao không hoàn hảo sang các quần thể khác, làm dấy lên cả những lo ngại khoa học về khả năng khái quát hóa và những lo ngại về sự công bằng về việc ai được hưởng lợi từ y học gen.
Key figures
- Peter Visscher
- Mark McCarthy
- Joel Hirschhorn
- Naomi Wray
- Jian Yang
Related topics
Seminal works
- wtccc-2007
- mccarthy-2008
- visscher-2012
- visscher-2017
Frequently asked questions
- Sự khác biệt giữa GWAS và nghiên cứu liên kết là gì?
- Các nghiên cứu liên kết theo dõi sự phân ly đồng thời của các dấu hiệu và bệnh trong các gia đình và định vị các vùng nhiễm sắc thể rộng, trong khi GWAS kiểm tra mối liên hệ giữa các cá thể không liên quan ở độ phân giải cao trên toàn bộ hệ gen, làm cho nó phù hợp hơn với các biến thể phổ biến có tác động nhỏ.
- Tại sao GWAS sử dụng ngưỡng ý nghĩa nghiêm ngặt như vậy?
- Vì hàng triệu biến thể được kiểm tra, một giá trị p thông thường là 0,05 sẽ tạo ra số lượng lớn các dương tính giả; ngưỡng trên toàn bộ hệ gen gần 5 x 10^-8 tính đến việc kiểm tra đa bội ngụ ý bởi sự biến đổi phổ biến độc lập trên toàn bộ hệ gen.