Giải trình tự toàn bộ hệ gen
Giải trình tự toàn bộ hệ gen (WGS) xác định trình tự nucleotide gần như hoàn chỉnh của hệ gen sinh vật trong một lần phân tích duy nhất, thay vì nhắm mục tiêu vào các gen hoặc vùng chọn lọc. Bằng cách đọc cả DNA mã hóa và không mã hóa, WGS cung cấp bộ dữ liệu gen sơ cấp toàn diện nhất và đóng vai trò là đầu vào cho việc lắp ráp, gọi biến thể và phân tích gen tiếp theo.
Definition
Giải trình tự toàn bộ hệ gen là quá trình trong phòng thí nghiệm và tính toán để xác định thứ tự của tất cả các nucleotide trong hệ gen của một sinh vật, điển hình là bằng cách phân đoạn DNA, đọc các đoạn ở độ phủ dư thừa và tái tạo hoặc căn chỉnh chúng để phục hồi trình tự đầy đủ.
Scope
Mục này bao gồm những gì WGS đo lường, chiến lược shotgun về việc phân đoạn và đọc hệ gen ở độ phủ cao, sự tương phản với các phương pháp tiếp cận có mục tiêu như giải trình tự toàn bộ exome, và vai trò của độ sâu giải trình tự trong việc xác định độ nhạy. Đây là một chủ đề về phương pháp luận và không cung cấp các khuyến nghị lâm sàng hoặc xét nghiệm.
Core questions
- Giải trình tự toàn bộ hệ gen thu được những gì mà giải trình tự có mục tiêu không thu được?
- Chiến lược shotgun tái tạo toàn bộ hệ gen từ nhiều đoạn ngắn như thế nào?
- Độ sâu giải trình tự ảnh hưởng đến việc phát hiện các biến thể như thế nào?
Key concepts
- Giải trình tự Shotgun
- Độ sâu và độ phủ giải trình tự
- Giải trình tự toàn bộ hệ gen so với giải trình tự toàn bộ exome
- Các vùng mã hóa và không mã hóa
- Hóa học kết thúc có thể đảo ngược
- Đầu vào gọi biến thể
Mechanisms
Trong WGS, DNA hệ gen được phân đoạn và đọc nhiều lần để mỗi vị trí được bao phủ bởi nhiều lần đọc độc lập; sự dư thừa (độ sâu) cho phép kiểm tra chéo các cuộc gọi cơ sở và hỗ trợ phát hiện các biến thể. Phương pháp shotgun toàn bộ hệ gen, được Venter và các đồng nghiệp chứng minh ở quy mô con người, chia hệ gen thành các đoạn ngẫu nhiên, giải trình tự chúng và lắp ráp lại chúng bằng máy tính. Hóa học kết thúc có thể đảo ngược sau đó cho phép đọc chính xác song song hàng loạt toàn bộ hệ gen người với chi phí thấp hơn nhiều. Bởi vì WGS đọc cả DNA không mã hóa cũng như DNA mã hóa, nó thu được sự biến đổi điều hòa và cấu trúc mà các xét nghiệm có mục tiêu bỏ qua.
Clinical relevance
Giải trình tự toàn bộ hệ gen ngày càng được sử dụng trong nghiên cứu và gen học lâm sàng để mô tả đặc điểm di truyền hoàn chỉnh của một cá nhân, hỗ trợ khám phá biến thể trên các vùng mã hóa và không mã hóa. Mục này mô tả phương pháp và đặc điểm dữ liệu của nó; đây là tài liệu tham khảo giáo dục và không phải là khuyến nghị cho bất kỳ xét nghiệm hoặc hành động lâm sàng cụ thể nào.
Evidence & guidelines
Bằng chứng nền tảng là một tập hợp các nghiên cứu sơ cấp mang tính bước ngoặt: hai trình tự hệ gen người được công bố vào năm 2001 (Venter et al.; International Human Genome Sequencing Consortium) và sự chứng minh về giải trình tự toàn bộ hệ gen song song hàng loạt chính xác của Bentley et al. (2008). Các đánh giá về phương pháp luận như Sims et al. (2014) ghi lại cách độ sâu và độ phủ định hình độ nhạy phân tích.
History
Giải trình tự toàn bộ hệ gen ở quy mô con người lần đầu tiên đạt được vào năm 2001 thông qua hai nỗ lực song song, một sử dụng giải trình tự dựa trên dòng vô tính phân cấp và một sử dụng lắp ráp shotgun toàn bộ hệ gen. Việc chứng minh giải trình tự chính xác bằng hóa học kết thúc có thể đảo ngược vào năm 2008 đã làm cho WGS quy mô dân số trở nên khả thi, và độ sâu và độ phủ trở thành các thông số thiết kế trung tâm khi phương pháp này trưởng thành.
Key figures
- J. Craig Venter
- Eric Lander
- David Bentley
Related topics
Seminal works
- venter-2001
- ihgsc-2001-wgs
- bentley-2008
Frequently asked questions
- Giải trình tự toàn bộ hệ gen khác với giải trình tự toàn bộ exome như thế nào?
- Giải trình tự toàn bộ hệ gen đọc về cơ bản toàn bộ hệ gen, bao gồm các vùng không mã hóa và điều hòa, trong khi giải trình tự toàn bộ exome chỉ nhắm mục tiêu vào phần mã hóa protein (exome), vốn là một phần nhỏ của hệ gen.
- Tại sao độ sâu giải trình tự lại quan trọng trong giải trình tự toàn bộ hệ gen?
- Độ sâu (số lần đọc bao phủ mỗi vị trí) xác định mức độ tự tin có thể thực hiện các cuộc gọi cơ sở và biến thể; độ sâu cao hơn cải thiện độ nhạy và độ chính xác, đặc biệt để phát hiện các biến thể tần số thấp hoặc dị hợp tử.