Đa dạng Nucleotide và Phân loại Biến thể
Đa dạng nucleotide đo lường mức độ khác biệt trung bình giữa hai trình tự được chọn ngẫu nhiên từ một quần thể, trong khi phân loại biến thể sắp xếp nhiều loại khác biệt DNA — thay thế một nucleotide, chèn và xóa nhỏ, và các thay đổi cấu trúc lớn hơn — thành một hệ thống thuật ngữ nhất quán. Cùng với nhau, chúng mô tả cả mức độ biến đổi mà bộ gen mang và hình thức của biến đổi đó.
Definition
Đa dạng nucleotide (thường được ký hiệu là pi) là số lượng khác biệt nucleotide trung bình trên mỗi vị trí giữa hai trình tự được lấy mẫu từ một quần thể; phân loại biến thể là việc phân loại có hệ thống các khác biệt trình tự quan sát được (ví dụ: biến thể một nucleotide, indel, biến thể cấu trúc).
Scope
Mục này bao gồm các thước đo tóm tắt tiêu chuẩn về biến đổi trình tự trong quần thể, đặc biệt là đa dạng nucleotide và số lượng vị trí phân ly, cũng như phân loại các loại biến thể theo kích thước và theo hiệu ứng dự đoán trên trình tự. Nó coi đây là các khái niệm mô tả và phương pháp luận; nó không gán ý nghĩa lâm sàng cho các biến thể cụ thể.
Core questions
- Làm thế nào để tóm tắt lượng biến đổi trình tự trong một mẫu?
- Đa dạng nucleotide và số lượng vị trí phân ly khác nhau như thế nào với tư cách là các ước tính?
- Các loại biến thể di truyền chính theo kích thước và loại là gì?
- Các biến thể được biểu diễn và trao đổi như thế nào trong một định dạng tệp tiêu chuẩn?
Key concepts
- Đa dạng nucleotide (pi)
- Các vị trí phân ly và theta của Watterson
- Biến thể một nucleotide (SNV/SNP)
- Chèn-xóa (indel)
- Biến thể cấu trúc
- Allele tham chiếu và thay thế
- Định dạng Cuộc gọi Biến thể (VCF)
Key theories
- Mô hình vị trí vô hạn và theta
- Theo giả định vị trí vô hạn, mỗi đột biến mới xuất hiện tại một vị trí chưa từng đột biến trước đó, do đó tham số đột biến quần thể theta có thể được ước tính từ số lượng vị trí phân ly (ước tính của Watterson) hoặc từ sự khác biệt trung bình theo cặp (đa dạng nucleotide); sự khác biệt có hệ thống giữa hai yếu tố này cung cấp thông tin về sự sai lệch so với tính trung tính.
Mechanisms
Biến đổi được phát hiện đầu tiên bằng cách căn chỉnh các trình tự đã giải mã với bộ gen tham chiếu và xác định các vị trí khác biệt; sau đó, các khác biệt được phân loại theo kích thước và hình thức. Các thống kê tóm tắt cô đọng điều này thành các thước đo cấp độ quần thể: số lượng vị trí phân ly là cơ sở cho ước tính theta của Watterson, trong khi sự khác biệt trung bình theo cặp xác định đa dạng nucleotide. Bởi vì cả hai đều ước tính cùng một tham số theo mô hình trung tính, kích thước không đổi, sự khác biệt của chúng (được Tajima chính thức hóa) báo hiệu sự thay đổi nhân khẩu học hoặc chọn lọc. Biểu diễn tiêu chuẩn hóa trong Định dạng Cuộc gọi Biến thể (Variant Call Format) cho phép các biến thể được lưu trữ, chia sẻ và so sánh giữa các nghiên cứu.
Clinical relevance
Một hệ thống thuật ngữ biến thể nhất quán và các ước tính đa dạng đáng tin cậy là điều kiện tiên quyết để diễn giải dữ liệu bộ gen trong môi trường y tế, bởi vì cùng các danh mục mô tả được sử dụng khi một bộ gen được giải mã được sàng lọc để tìm các biến thể có liên quan lâm sàng. Mục này giải thích cách các biến thể được mô tả và đếm và không phải là cơ sở cho các quyết định chẩn đoán hoặc điều trị cá nhân.
Evidence & guidelines
Các ước tính cơ bản về đa dạng trình tự đã được Watterson và Tajima thiết lập, trong khi các khảo sát lớn như bản đồ SNP người ban đầu và tài liệu tham khảo Dự án 1000 Bộ gen cung cấp quy mô thực nghiệm về biến đổi ở người. Định dạng Cuộc gọi Biến thể (Variant Call Format) và các công cụ của nó là tiêu chuẩn cộng đồng thực tế để biểu diễn các biến thể đã được phân loại.
History
Di truyền học quần thể phân tử ban đầu định lượng biến đổi thông qua các khảo sát allozyme và vị trí cắt giới hạn, sau đó thông qua giải trình tự DNA. Công trình của Watterson năm 1975 và Tajima năm 1989 đã đưa ra các ước tính vẫn được sử dụng ngày nay, và bản đồ SNP người năm 2001 và các liên minh giải trình tự sau đó đã biến việc lập danh mục biến thể thành một công việc trên toàn bộ bộ gen, đi kèm với các định dạng tiêu chuẩn như VCF để biểu diễn các biến thể thu được.
Key figures
- G. A. Watterson
- Fumio Tajima
- Richard Durbin
- Gonçalo Abecasis
Related topics
Seminal works
- watterson-1975
- tajima-1989
- snp-map-2001
Frequently asked questions
- Sự khác biệt giữa đa dạng nucleotide và số lượng vị trí phân ly là gì?
- Số lượng vị trí phân ly đếm số vị trí thay đổi trong một mẫu, trong khi đa dạng nucleotide tính trung bình sự khác biệt giữa các cặp trình tự; cả hai đều ước tính cùng một tham số cơ bản theo một mô hình trung tính đơn giản, và sự khác biệt của chúng tự nó đã mang tính thông tin.
- SNP có giống với đột biến không?
- SNP là một biến thể một nucleotide được quan sát thấy đang phân ly trong một quần thể; nó bắt nguồn từ một đột biến điểm, nhưng thuật ngữ này nhấn mạnh rằng biến thể có mặt ở tần số đáng kể chứ không phải là một thay đổi mới phát sinh ở một cá thể.