Các phương pháp suy luận về sự pha trộn và nguồn gốc tổ tiên
Các phương pháp suy luận về sự pha trộn và nguồn gốc tổ tiên ước tính, từ kiểu gen của một cá thể, tỷ lệ bộ gen của họ có nguồn gốc từ các quần thể tổ tiên khác nhau, và kiểm tra xem các quần thể có trao đổi gen trong quá khứ hay không. Chúng biến các mô hình chia sẻ alen thành các tuyên bố định lượng về nguồn gốc tổ tiên và sự pha trộn quần thể.
Definition
Suy luận nguồn gốc tổ tiên là ước tính nguồn gốc tổ tiên của bộ gen một cá thể từ dữ liệu di truyền; suy luận pha trộn đặc biệt ước tính tỷ lệ đóng góp của các quần thể tổ tiên riêng biệt và kiểm tra dòng gen lịch sử giữa chúng.
Scope
Mục này bao gồm phân cụm dựa trên mô hình và ước tính tỷ lệ nguồn gốc tổ tiên, các phương pháp giảm chiều, và các kiểm định chính thức về sự pha trộn, cùng với các giả định mà các phương pháp này dựa vào. Đây là một chủ đề về phương pháp luận; nó mô tả suy luận thống kê về nguồn gốc di truyền và không đưa ra bất kỳ tuyên bố lâm sàng hoặc xã hội nào về các loại nguồn gốc tổ tiên.
Core questions
- Tỷ lệ nguồn gốc tổ tiên được ước tính từ dữ liệu kiểu gen như thế nào?
- Các phương pháp phân cụm dựa trên mô hình và thành phần chính khác nhau như thế nào?
- Dòng gen trong quá khứ giữa các quần thể được kiểm định chính thức như thế nào?
- Những giả định và hạn chế nào ảnh hưởng đến ước tính nguồn gốc tổ tiên?
Key concepts
- Tỷ lệ nguồn gốc tổ tiên
- Phân cụm dựa trên mô hình (STRUCTURE/ADMIXTURE)
- Số lượng quần thể nguồn (K)
- Phân tích thành phần chính
- Thống kê f và kiểm định pha trộn
- Bảng tham chiếu cho nguồn gốc tổ tiên
Key theories
- Hỗn hợp nguồn gốc tổ tiên dựa trên mô hình
- Bộ gen của mỗi cá thể được mô hình hóa như một hỗn hợp được rút ra từ K quần thể tổ tiên với tần số alen riêng biệt; các phương pháp dựa trên khả năng xảy ra hoặc Bayes cùng ước tính tần số alen tổ tiên và tỷ lệ nguồn gốc tổ tiên của mỗi cá thể, cung cấp một sự phân tách xác suất của cấu trúc.
Mechanisms
Các phương pháp dựa trên mô hình coi mỗi bộ gen là một hỗn hợp từ K quần thể tổ tiên và ước tính, bằng khả năng xảy ra hoặc suy luận Bayes, cả tần số alen tổ tiên và tỷ lệ hỗn hợp của mỗi cá thể; một triển khai khả năng xảy ra tối đa hiệu quả đã giúp điều này khả thi ở quy mô bộ gen. Các phương pháp bổ sung sử dụng phân tích thành phần chính để đặt các cá thể vào một không gian nguồn gốc tổ tiên có chiều thấp mà không cần xác định trước các quần thể. Các kiểm định pha trộn chính thức được xây dựng trên thống kê f so sánh các mô hình chia sẻ alen giữa các quần thể để phát hiện và định lượng dòng gen lịch sử. Tất cả những điều này phụ thuộc vào các quần thể tham chiếu thích hợp và vào việc lựa chọn số lượng quần thể nguồn.
Clinical relevance
Suy luận nguồn gốc tổ tiên hỗ trợ xử lý đúng cấu trúc quần thể trong các nghiên cứu di truyền và sử dụng thích hợp dữ liệu tham chiếu phù hợp với nguồn gốc tổ tiên khi giải thích kết quả bộ gen. Mục này mô tả các phương pháp thống kê được sử dụng để ước tính nguồn gốc di truyền và không phải là cơ sở cho các quyết định chẩn đoán hoặc điều trị cá nhân, cũng như không phải để đánh đồng nguồn gốc di truyền với bản sắc xã hội.
Evidence & guidelines
Ước tính nguồn gốc tổ tiên dựa trên mô hình được thiết lập bởi khung STRUCTURE và được mở rộng quy mô bằng các triển khai khả năng xảy ra tối đa, trong khi các phương pháp thành phần chính và kiểm định pha trộn thống kê f cung cấp các phương pháp bổ sung, được sử dụng rộng rãi; các khảo sát toàn bộ bộ gen về sự biến đổi của con người trên toàn thế giới chứng minh ứng dụng của chúng trên các quần thể.
History
Phân cụm dựa trên mô hình của các kiểu gen đa locus được giới thiệu vào khoảng năm 2000 và nhanh chóng trở thành tiêu chuẩn để mô tả cấu trúc quần thể; các triển khai khả năng xảy ra tối đa nhanh hơn đã ra đời khi dữ liệu toàn bộ bộ gen tăng lên. Các phương pháp thành phần chính được điều chỉnh để suy luận nguồn gốc tổ tiên vào giữa những năm 2000, và các khung thống kê f đã chính thức hóa các kiểm định về sự pha trộn cổ đại, cùng nhau biến suy luận nguồn gốc tổ tiên và pha trộn thành các công cụ trung tâm của bộ gen học quần thể.
Debates
- Nên chọn và giải thích số lượng quần thể nguồn (K) như thế nào?
- Các phương pháp dựa trên mô hình yêu cầu chỉ định hoặc chọn K, nhưng các cụm được suy luận là các cấu trúc thống kê mà việc giải thích của chúng phụ thuộc vào việc lấy mẫu và vào K; coi chúng là các quần thể tự nhiên, rời rạc có thể gây hiểu lầm.
Key figures
- Jonathan Pritchard
- John Novembre
- David Reich
- Nick Patterson
Related topics
Seminal works
- pritchard-2000
- alexander-2009
- patterson-2012
Frequently asked questions
- Tỷ lệ nguồn gốc tổ tiên, ví dụ, 30% từ một quần thể có nghĩa là gì?
- Đó là một ước tính dựa trên mô hình rằng khoảng 30% bộ gen của cá thể được giải thích tốt nhất bằng tần số alen của nguồn tổ tiên được suy luận đó; đó là một sự phân tách thống kê tương đối so với các quần thể tham chiếu được chọn, không phải là một nhãn sinh học cố định.
- Sự pha trộn giữa các quần thể được phát hiện như thế nào?
- Các kiểm định chính thức dựa trên thống kê f so sánh các mô hình biến đổi chung giữa một số quần thể; sự sai lệch so với những gì được mong đợi nếu không có dòng gen cung cấp bằng chứng cho thấy sự pha trộn đã xảy ra.