ScholarGate
Trợ lý

Mất cân bằng liên kết và gắn thẻ SNP

Mất cân bằng liên kết (LD) là sự đồng xuất hiện không ngẫu nhiên của các alen tại các vị trí khác nhau trong bộ gen: các biến thể gần nhau có xu hướng được di truyền cùng nhau dưới dạng các khối haplotype. Mối tương quan này là điều làm cho các nghiên cứu liên kết toàn bộ gen trở nên khả thi về mặt chi phí – một mảng kiểu gen chỉ cần xác định kiểu gen của một tập hợp con các SNP 'gắn thẻ' được chọn lọc cẩn thận, bởi vì mỗi thẻ đại diện về mặt thống kê cho các biến thể chưa được xác định kiểu gen mà nó có LD mạnh.

Tìm chủ đề với PaperMindSắp ra mắtFind papers & topics
Tools & resources
Tải xuống bản trình chiếu
Learn & explore
VideoSắp ra mắt

Definition

Mất cân bằng liên kết là sự liên kết thống kê giữa các alen tại hai hoặc nhiều locus – sự đồng xuất hiện của chúng trên các haplotype thường xuyên hơn hoặc ít thường xuyên hơn so với dự kiến nếu chúng độc lập – và gắn thẻ SNP là việc sử dụng một tập hợp con các biến thể mà, thông qua LD, nắm bắt sự biến đổi của các vị trí lân cận chưa được xác định kiểu gen.

Scope

Chủ đề này giải thích LD là gì, cách đo lường nó (D' và r-bình phương), tại sao nó hình thành các khối được định hình bởi tái tổ hợp và lịch sử quần thể, cách chọn SNP gắn thẻ để nắm bắt hiệu quả sự biến đổi phổ biến, và cách LD vừa cho phép lập bản đồ liên kết vừa làm phức tạp việc định vị các biến thể gây bệnh. Đây là một tài liệu tham khảo về phương pháp luận, không phải hướng dẫn lâm sàng.

Core questions

  • Hai biến thể ở trạng thái mất cân bằng liên kết có nghĩa là gì?
  • D' và r-bình phương được sử dụng như thế nào để định lượng LD, và chúng khác nhau như thế nào?
  • Tại sao bộ gen lại chia thành các khối haplotype, và điều gì xác định ranh giới của chúng?
  • Các SNP gắn thẻ được chọn như thế nào để một mảng nắm bắt được hầu hết các biến đổi phổ biến?
  • Tại sao LD gây khó khăn trong việc xác định biến thể gây bệnh thực sự trong một vùng liên kết?

Key concepts

  • Haplotype và khối haplotype
  • D' (hệ số mất cân bằng chuẩn hóa)
  • r-bình phương (tương quan giữa các dấu hiệu)
  • Điểm nóng tái tổ hợp
  • Lựa chọn SNP gắn thẻ
  • Các bảng haplotype tham chiếu (HapMap, 1000 Genomes)
  • Lập bản đồ chi tiết và sự mơ hồ của biến thể gây bệnh

Mechanisms

Các alen tại các locus gần nhau được di truyền cùng nhau cho đến khi tái tổ hợp tách chúng ra, vì vậy qua nhiều thế hệ, LD suy giảm theo khoảng cách di truyền và bị phá vỡ tại các điểm nóng tái tổ hợp, tạo ra các khối có tương quan nội bộ cao. Hai thước đo phổ biến định lượng nó: D' nắm bắt liệu tái tổ hợp đã xảy ra giữa hai vị trí hay chưa, trong khi r-bình phương đo lường mức độ một biến thể dự đoán biến thể khác và trực tiếp chi phối sức mạnh bị mất khi một SNP gắn thẻ đại diện cho một biến thể gây bệnh chưa được xác định kiểu gen. Bởi vì các biến thể trong một khối có tương quan mạnh mẽ, một mảng có thể xác định kiểu gen của một tập hợp các SNP gắn thẻ đã chọn và phục hồi hầu hết các biến đổi phổ biến, và các biến thể bị thiếu có thể được suy luận thống kê dựa trên các bảng tham chiếu đã được giải trình tự như HapMap và Dự án 1000 Genomes. Mối tương quan tương tự cho phép gắn thẻ cũng có nghĩa là một tín hiệu liên kết được chia sẻ trên nhiều biến thể trong một khối, vì vậy việc xác định biến thể gây bệnh thực sự đòi hỏi phải lập bản đồ chi tiết bổ sung thay vì chỉ đơn giản là lấy dấu hiệu quan trọng nhất.

Clinical relevance

Cấu trúc LD là nền tảng cho cách tạo ra bằng chứng di truyền toàn bộ gen và cách các vùng liên kết được diễn giải trong nghiên cứu bệnh tật. Chủ đề này mô tả phương pháp và di truyền học quần thể; nó không phải là cơ sở để xét nghiệm di truyền cá nhân hoặc diễn giải lâm sàng.

Evidence & guidelines

Kiến thức về cấu trúc LD của con người dựa trên các nguồn tài nguyên tham khảo lớn hơn là các hướng dẫn lâm sàng. Dự án HapMap Quốc tế (2007) đã lập bản đồ LD và các SNP gắn thẻ trên toàn bộ gen, Dự án 1000 Genomes (2015) đã mở rộng các haplotype tham chiếu trên các quần thể đa dạng, và các đánh giá như Slatkin (2008) và Bush và Moore (2012) giải thích cách các thước đo LD và gắn thẻ được áp dụng trong lập bản đồ liên kết.

History

Khái niệm liên kết alen có trước gen học, nhưng tầm quan trọng thực tiễn của nó tăng lên cùng với việc phát hiện vào đầu những năm 2000 rằng bộ gen người có cấu trúc haplotype dạng khối được định hình bởi các điểm nóng tái tổ hợp. Dự án HapMap sau đó đã lập danh mục LD trên toàn bộ gen và làm cho việc lựa chọn SNP gắn thẻ trở nên khả thi, điều này trực tiếp cho phép tạo ra các mảng GWAS giá cả phải chăng đầu tiên. Dự án 1000 Genomes sau đó đã mở rộng các bảng tham chiếu cho nhiều quần thể, cải thiện việc suy luận và tiết lộ cách các mẫu LD khác nhau theo tổ tiên.

Debates

Các mẫu LD có chuyển giao giữa các quần thể không?
Cấu trúc haplotype và LD thay đổi theo lịch sử quần thể, vì vậy các SNP gắn thẻ và bảng suy luận được tối ưu hóa trong một tổ tiên sẽ nắm bắt sự biến đổi không hoàn hảo trong một tổ tiên khác, góp phần làm giảm hiệu suất của các mảng và điểm số có nguồn gốc từ châu Âu ở các quần thể khác.

Key figures

  • Montgomery Slatkin
  • Mark Daly
  • David Altshuler
  • Goncalo Abecasis
  • William Bush

Related topics

Seminal works

  • slatkin-2008
  • hapmap-2007
  • 1000g-2015

Frequently asked questions

Mất cân bằng liên kết cho phép GWAS chỉ xác định kiểu gen của một số biến thể như thế nào?
Bởi vì các biến thể trong một khối haplotype có tương quan mạnh mẽ, một SNP gắn thẻ đã được xác định kiểu gen mang thông tin về các biến thể lân cận chưa được xác định kiểu gen của nó, vì vậy một mảng các thẻ được chọn lọc kỹ càng sẽ nắm bắt hầu hết các biến đổi phổ biến trong bộ gen.
Sự khác biệt giữa D' và r-bình phương là gì?
D' đo lường liệu tái tổ hợp đã tách hai alen trong lịch sử hay chưa, trong khi r-bình phương đo lường mức độ một biến thể dự đoán thống kê biến thể khác; r-bình phương là đại lượng liên quan nhất đến sức mạnh của thử nghiệm liên kết dựa trên SNP gắn thẻ.

Methods for this concept

Related concepts