Các Phương Pháp Suy Luận Phát Sinh Chủng Loại
Một nhóm các phương pháp tính toán, bao gồm khoảng cách, tính tiết kiệm, khả năng hợp lý tối đa và Bayes, ước tính cây tiến hóa từ dữ liệu phân tử và hình thái.
Definition
Các phương pháp suy luận phát sinh chủng loại là các thuật toán và khuôn khổ thống kê ước tính các mối quan hệ phân nhánh giữa các đơn vị phân loại từ dữ liệu đặc điểm quan sát được, thường theo các mô hình rõ ràng về sự thay đổi tiến hóa.
Scope
Chủ đề này bao gồm các loại chính của phương pháp ước tính cây: phương pháp khoảng cách như neighbor-joining, tính tiết kiệm dựa trên đặc điểm, khả năng hợp lý tối đa dựa trên mô hình và suy luận Bayes sử dụng Markov chain Monte Carlo, cùng với các mô hình thay thế, tiêu chí tối ưu và phần mềm triển khai chúng.
Core questions
- Các loại chính của phương pháp suy luận cây là gì?
- Các phương pháp khoảng cách, tính tiết kiệm, khả năng hợp lý và Bayes khác nhau như thế nào?
- Các mô hình thay thế đóng vai trò gì trong suy luận?
- Các phương pháp mở rộng như thế nào đối với các tập dữ liệu lớn?
Key theories
- Suy luận khả năng hợp lý tối đa
- Khả năng hợp lý tối đa chọn cây và các tham số mô hình làm cho các trình tự quan sát được có khả năng xảy ra cao nhất theo một mô hình thay thế rõ ràng, cung cấp một khuôn khổ nhất quán về mặt thống kê.
- Các phương pháp khoảng cách
- Các phương pháp khoảng cách như neighbor-joining chuyển đổi sự khác biệt trình tự từng cặp thành một cây một cách nhanh chóng, mang lại tốc độ với cái giá là loại bỏ thông tin cấp độ đặc điểm.
- Suy luận Bayes với MCMC
- Các phương pháp Bayes lấy mẫu cây theo tỷ lệ xác suất hậu nghiệm của chúng bằng cách sử dụng Markov chain Monte Carlo, mang lại cả ước tính cây và thước đo sự không chắc chắn.
Clinical relevance
Các phương pháp này được sử dụng để tái tạo lịch sử lây truyền mầm bệnh, xác định thời gian các sự kiện phân kỳ và đặt các sinh vật mới được phát hiện vào vị trí, hỗ trợ trực tiếp cho dịch tễ học phân tử và bộ gen so sánh.
History
Khuôn khổ khả năng hợp lý của Felsenstein vào năm 1981 và phương pháp neighbor-joining của Saitou và Nei vào năm 1987 đã thiết lập các truyền thống thống kê và khoảng cách; các phần mềm được áp dụng rộng rãi như MrBayes và RAxML vào những năm 2000 đã làm cho các phân tích Bayes và khả năng hợp lý quy mô lớn trở nên thường quy.
Debates
- Tốc độ so với độ chính xác giữa các phương pháp
- Các phương pháp khoảng cách và tính tiết kiệm nhanh nhưng đơn giản hóa mạnh mẽ hơn, trong khi các phương pháp khả năng hợp lý và Bayes chính xác hơn nhưng đòi hỏi tính toán cao, một sự đánh đổi định hình lựa chọn phương pháp cho các tập dữ liệu lớn.
Key figures
- Joseph Felsenstein
- Masatoshi Nei
- John Huelsenbeck
Related topics
Seminal works
- felsenstein1981
- saitounei1987
- ronquist2003
- stamatakis2006
Frequently asked questions
- Sự khác biệt giữa phát sinh chủng loại khả năng hợp lý tối đa và Bayes là gì?
- Khả năng hợp lý tối đa tìm ra một cây và các tham số duy nhất phù hợp nhất với dữ liệu, trong khi suy luận Bayes tạo ra một phân bố các cây được trọng số theo xác suất hậu nghiệm của chúng, thể hiện sự không chắc chắn một cách tự nhiên.
- Tại sao cần có các mô hình thay thế?
- Bởi vì sự khác biệt trình tự quan sát được đánh giá thấp số lượng thay đổi thực sự khi các vị trí đột biến nhiều hơn một lần; các mô hình điều chỉnh các tỷ lệ không đồng đều và nhiều lần đột biến để ước tính cây một cách chính xác.