Các Biến Thể Số Lượng Bản Sao: Phát Hiện và Phân Loại
Biến thể số lượng bản sao (CNV) là một đoạn DNA có số lượng bản sao khác nhau giữa các cá thể—được tăng lên thông qua sự nhân đôi hoặc bị mất đi thông qua sự xóa bỏ so với bộ gen tham chiếu. CNV là một thành phần chính của biến thể cấu trúc, và các câu hỏi phương pháp luận trọng tâm là làm thế nào để phát hiện chúng một cách đáng tin cậy từ dữ liệu mảng hoặc trình tự và làm thế nào để phân loại chúng theo kích thước, trạng thái bản sao và ý nghĩa có thể có.
Definition
Biến thể số lượng bản sao là một đoạn DNA, theo quy ước có kích thước từ một kilobase trở lên, khác biệt về số lượng bản sao hiện diện so với bộ gen tham chiếu, phát sinh dưới dạng xóa bỏ (mất bản sao) hoặc nhân đôi hoặc khuếch đại bậc cao hơn (tăng bản sao).
Scope
Chủ đề này bao gồm CNV là gì, các công nghệ chính được sử dụng để phát hiện và xác định kích thước của chúng (lai hóa bộ gen so sánh trên mảng, mảng SNP, và tín hiệu độ sâu đọc hoặc đầu cặp từ trình tự), và các cơ sở để phân loại chúng—tăng so với mất, số lượng bản sao, tái phát, và tần số. Đây là một tài liệu tham khảo về các khái niệm phát hiện và phân loại và không cung cấp diễn giải chẩn đoán cho từng cá nhân.
Core questions
- Điều gì phân biệt biến thể số lượng bản sao với các biến thể cấu trúc khác?
- Những tín hiệu nào—cường độ lai hóa, độ sâu đọc, bằng chứng đầu cặp và đọc tách—được sử dụng để gọi CNV?
- CNV được phân loại như thế nào theo trạng thái bản sao, kích thước, tái phát và tần số quần thể?
- Giới hạn độ phân giải và nguồn lỗi sai của mỗi nền tảng phát hiện là gì?
Key concepts
- Tăng bản sao (nhân đôi) và mất bản sao (xóa bỏ)
- Lai hóa bộ gen so sánh trên mảng (aCGH)
- Tỷ lệ log R và tần số alen B của mảng SNP
- Phát hiện độ sâu đọc và đầu cặp
- Độ phân giải điểm đứt gãy
- CNV tái phát so với không tái phát
- Tần số quần thể và phân loại lành tính so với gây bệnh
Mechanisms
Phát hiện CNV chuyển đổi một thay đổi vật lý trong liều lượng DNA thành một tín hiệu có thể đo lường được. Lai hóa bộ gen so sánh trên mảng và mảng SNP đọc cường độ lai hóa tương đối, do đó một sự xóa bỏ làm giảm và một sự nhân đôi làm tăng tín hiệu trên khoảng bị ảnh hưởng; mảng SNP bổ sung thông tin tỷ lệ alen giúp phân biệt các trạng thái bản sao. Các phương pháp dựa trên trình tự suy ra số lượng bản sao từ độ sâu đọc—nhiều đọc hơn tích lũy trên các vùng nhân đôi và ít hơn trên các vùng xóa bỏ—và sử dụng các căn chỉnh đầu cặp không khớp và đọc tách để định vị các điểm đứt gãy. Phân loại sau đó kết hợp trạng thái bản sao, kích thước, liệu biến thể có tái phát tại các điểm đứt gãy được xác định bởi kiến trúc hay không, và tần số của nó trong các quần thể tham chiếu.
Clinical relevance
Phân tích số lượng bản sao được sử dụng rộng rãi trong khoa học sức khỏe để đặc trưng hóa các sự tăng và mất bộ gen, và việc phân biệt các CNV lành tính phổ biến với các sự kiện thay đổi liều lượng hiếm gặp là trọng tâm để diễn giải dữ liệu bộ gen. Mục này mô tả cách CNV được phát hiện và phân loại như một vấn đề phương pháp luận; nó không phải là cơ sở để chẩn đoán hoặc quản lý cá nhân.
Epidemiology
Các khảo sát toàn bộ bộ gen ban đầu đã xác định rằng CNV phổ biến ở những cá thể khỏe mạnh: Sebat và các đồng nghiệp lần đầu tiên chỉ ra sự đa hình số lượng bản sao rộng rãi, và Redon cùng các đồng nghiệp đã lập bản đồ CNV toàn cầu trên các quần thể HapMap. Các danh mục dựa trên trình tự sau đó, bao gồm bản đồ biến thể cấu trúc của 1000 Genomes, đã tinh chỉnh tần số và cho thấy rằng các sự xóa bỏ và nhân đôi cùng nhau bao phủ một phần lớn của bộ gen biến đổi.
History
Sự công nhận rằng số lượng bản sao thay đổi rộng rãi giữa những người khỏe mạnh xuất hiện vào năm 2004 từ các nghiên cứu mảng của Sebat và Iafrate cùng các đồng nghiệp, lật đổ giả định rằng biến thể như vậy là hiếm. Các bản đồ CNV toàn bộ bộ gen từ các nền tảng mảng đã ra đời vào năm 2006, và sự chuyển đổi sang trình tự thông lượng cao trong thập kỷ tiếp theo đã mang lại các phương pháp độ sâu đọc và đầu cặp giúp cải thiện độ phân giải điểm đứt gãy và hợp nhất việc gọi CNV vào việc khám phá biến thể cấu trúc nói chung.
Debates
- Làm thế nào để dung hòa sự khác biệt giữa các nền tảng phát hiện?
- Các bộ gọi dựa trên mảng và trình tự báo cáo các tập hợp CNV chồng chéo nhưng không giống hệt nhau, khác nhau về độ phân giải kích thước, độ chính xác điểm đứt gãy và độ nhạy trong các vùng lặp lại, do đó việc hài hòa các cuộc gọi và tần số trên các nền tảng vẫn là một thách thức phương pháp luận được công nhận.
Key figures
- Jonathan Sebat
- Stephen W. Scherer
- Charles Lee
- Evan E. Eichler
- Nigel P. Carter
Related topics
Seminal works
- sebat-2004
- redon-2006
- alkan-2011
Frequently asked questions
- Sự khác biệt giữa CNV và xóa bỏ là gì?
- Xóa bỏ là một loại biến thể số lượng bản sao (mất bản sao). Thuật ngữ CNV rộng hơn và cũng bao gồm nhân đôi và tăng bản sao bậc cao hơn, vì vậy mọi xóa bỏ có kích thước liên quan đều là CNV nhưng không phải mọi CNV đều là xóa bỏ.
- Tại sao hai nền tảng có thể báo cáo các CNV khác nhau cho cùng một mẫu?
- Các phương pháp mảng và trình tự khác nhau về độ phân giải, độ chính xác điểm đứt gãy và độ nhạy trong các vùng lặp lại, vì vậy chúng thu nhận các tập hợp biến thể chồng chéo nhưng không giống hệt nhau và có thể xác định kích thước cùng một sự kiện khác nhau.
Methods for this concept
- Copy Number Variation Analysis
- Machine learning-assisted copy number variation analysis
- Bayesian Copy Number Variation Analysis
- Differential Copy Number Variation Analysis
- Single-cell Copy Number Variation Analysis
- Variant Calling
- Time-series copy number variation analysis
- Network-based copy number variation analysis