Các Công Nghệ Giải Trình Tự Thế Hệ Mới
Giải trình tự thế hệ mới (NGS), còn được gọi là giải trình tự thông lượng cao hoặc song song hóa khối lượng lớn, đề cập đến các nền tảng đọc hàng triệu đến hàng tỷ đoạn DNA cùng lúc, thay thế phương pháp Sanger chỉ đọc từng đoạn một. Các công nghệ này đã giảm chi phí giải trình tự xuống nhiều bậc và giúp các nghiên cứu toàn bộ hệ gen, exome và transcriptome trở nên thường quy.
Definition
Các công nghệ giải trình tự thế hệ mới là các nền tảng xác định trình tự nucleotide bằng cách đọc một số lượng rất lớn các đoạn DNA song song, tạo ra dữ liệu thông lượng cao với chi phí trên mỗi base thấp, trái ngược với việc đọc điện di tuần tự của giải trình tự Sanger.
Scope
Mục này khảo sát các họ nền tảng thông lượng cao, bao gồm giải trình tự đọc ngắn bằng tổng hợp (sequencing-by-synthesis) và các phương pháp phân tử đơn đọc dài như nanopore và giải trình tự thời gian thực phân tử đơn, sự đánh đổi giữa độ dài đọc và độ chính xác phân biệt chúng, và tác động của chúng đến quy mô của genomics. Đây là một tổng quan về phương pháp luận, không phải là sự so sánh để đưa ra quyết định mua sắm hoặc xét nghiệm lâm sàng.
Core questions
- Điều gì phân biệt giải trình tự thế hệ mới với giải trình tự Sanger trước đây?
- Các nền tảng đọc ngắn và đọc dài khác nhau như thế nào về độ dài đọc, độ chính xác và ứng dụng?
- Giải trình tự thông lượng cao đã thay đổi quy mô và chi phí của genomics như thế nào?
Key concepts
- Giải trình tự song song hóa khối lượng lớn
- Giải trình tự bằng tổng hợp
- Nền tảng đọc ngắn so với đọc dài
- Giải trình tự thời gian thực phân tử đơn
- Giải trình tự nanopore
- Sự đánh đổi giữa độ dài đọc và độ chính xác trên mỗi base
- Chi phí trên mỗi base
Mechanisms
Các nền tảng thông lượng cao cố định và đọc một số lượng lớn các đoạn DNA cùng lúc. Giải trình tự đọc ngắn bằng tổng hợp phát hiện từng base khi nó được kết hợp, thường sử dụng các chất kết thúc có thể đảo ngược, tạo ra các đoạn đọc ngắn nhưng có độ chính xác cao. Các phương pháp đọc dài đọc các phân tử đơn trong thời gian thực hoặc khi chúng đi qua một lỗ nano (nanopore), tạo ra các đoạn đọc dài hơn nhiều, bao phủ các vùng lặp lại và phức tạp về cấu trúc với chi phí là lỗi trên mỗi base cao hơn một chút. Sự lựa chọn giữa các nền tảng phản ánh sự đánh đổi giữa độ dài đọc, độ chính xác, thông lượng và chi phí tùy thuộc vào mục tiêu phân tích.
Clinical relevance
Giải trình tự thế hệ mới là công cụ chủ lực của nghiên cứu genomic hiện đại và genomic lâm sàng, cho phép mọi thứ từ phát hiện biến thể đến genomic của mầm bệnh và ung thư. Mục này mô tả các công nghệ và sự đánh đổi của chúng như tài liệu tham khảo và không khuyến nghị bất kỳ nền tảng hoặc xét nghiệm cụ thể nào cho mục đích sử dụng cá nhân.
Evidence & guidelines
Lĩnh vực này được ghi nhận thông qua các bài đánh giá có ảnh hưởng theo dõi sự phát triển của nền tảng: Metzker (2010), Reuter et al. (2015), và Goodwin et al. (2016) cho bức tranh tổng thể, và Wang et al. (2021) đặc biệt cho giải trình tự nanopore; Bentley et al. (2008) là một báo cáo sơ cấp cơ bản về đọc ngắn.
History
Sau khi giải trình tự Sanger thống trị trong ba thập kỷ, các nền tảng song song hóa khối lượng lớn thương mại xuất hiện vào giữa những năm 2000, với giải trình tự đọc ngắn bằng chất kết thúc có thể đảo ngược được chứng minh ở quy mô toàn bộ hệ gen vào năm 2008. Trong thập kỷ tiếp theo, thông lượng tăng và chi phí giảm mạnh, trong khi các nền tảng đọc dài phân tử đơn (giải trình tự thời gian thực phân tử đơn và giải trình tự nanopore) đã trưởng thành để giải quyết các hạn chế về độ dài đọc của các đoạn đọc ngắn.
Key figures
- Michael Metzker
- Michael Snyder
- W. Richard McCombie
- David Bentley
Related topics
Seminal works
- metzker-2009
- goodwin-2016
- wang-2021
Frequently asked questions
- Giải trình tự thế hệ mới bổ sung gì so với giải trình tự Sanger?
- Nó đọc hàng triệu đến hàng tỷ đoạn cùng lúc thay vì từng đoạn một, tăng thông lượng lên nhiều bậc và giảm chi phí, điều này giúp các nghiên cứu toàn bộ hệ gen và quy mô quần thể trở nên khả thi.
- Sự đánh đổi chính giữa giải trình tự đọc ngắn và đọc dài là gì?
- Các đoạn đọc ngắn thường có độ chính xác cao nhưng quá ngắn để bao phủ các đoạn lặp dài, trong khi các đoạn đọc dài bao phủ các vùng lặp lại và phức tạp về cấu trúc nhưng trong lịch sử có tỷ lệ lỗi trên mỗi base cao hơn.