Tiêu chuẩn và Chú thích Bộ gen Tham chiếu
Bộ gen tham chiếu là một trình tự đồng thuận được tuyển chọn, đại diện cho một loài, đóng vai trò là hệ thống tọa độ chung để căn chỉnh và diễn giải dữ liệu trình tự mới. Việc duy trì nó dưới dạng các bản dựng có phiên bản và bổ sung chú thích sinh học lên đó là điều giúp các kết quả bộ gen có thể so sánh được giữa các nghiên cứu, phòng thí nghiệm và theo thời gian.
Definition
Bộ gen tham chiếu là một trình tự nucleotide đồng thuận được tuyển chọn, được chọn để đại diện cho bộ gen của một loài, được duy trì dưới dạng các lắp ráp có phiên bản (bản dựng) và được chú thích với vị trí của các gen và các yếu tố chức năng khác, cung cấp một khung tọa độ ổn định để căn chỉnh và diễn giải dữ liệu bộ gen.
Scope
Mục này bao gồm lắp ráp tham chiếu là gì, cách nó được lập phiên bản thành các bản dựng kế tiếp (chẳng hạn như lắp ráp GRCh38 của người và lắp ráp từ telomere đến telomere), vai trò của chú thích trong việc đánh dấu các gen và các đặc điểm chức năng, và xu hướng hướng tới các tham chiếu đầy đủ và đại diện hơn. Đây là một chủ đề tham chiếu và cơ sở hạ tầng, không phải hướng dẫn lâm sàng.
Core questions
- Bộ gen tham chiếu là gì và tại sao lĩnh vực này lại tiêu chuẩn hóa trên một bộ gen?
- Lắp ráp tham chiếu được lập phiên bản thành các bản dựng kế tiếp như thế nào và tại sao?
- Chú thích bộ gen bổ sung gì vào trình tự tham chiếu?
Key concepts
- Lắp ráp tham chiếu (trình tự đồng thuận)
- Bản dựng và lập phiên bản bộ gen (ví dụ: GRCh38)
- Chú thích bộ gen
- Hệ thống tọa độ để căn chỉnh
- Lắp ráp telomere-to-telomere (không có khoảng trống)
- Khoảng trống lắp ráp và hoàn thiện
Mechanisms
Bộ gen tham chiếu được lắp ráp từ dữ liệu trình tự chất lượng cao thành một trình tự đồng thuận đại diện cho loài chứ không phải bất kỳ cá thể đơn lẻ nào, sau đó được phát hành dưới dạng bản dựng có phiên bản để các tọa độ bộ gen vẫn ổn định và có thể trích dẫn. Chú thích phủ lên trình tự với vị trí của các gen, bản phiên mã, và các yếu tố điều hòa và lặp lại, biến các tọa độ thô thành các bản đồ có thể diễn giải sinh học. Các bản dựng kế tiếp kết hợp các chỉnh sửa, điền vào các khoảng trống và cải thiện khả năng đại diện; bộ gen tham chiếu của người đã tiến triển từ bản nháp năm 2001 và trình tự euchromatin hoàn chỉnh năm 2004 đến bản dựng GRCh38 và cuối cùng là lắp ráp telomere-to-telomere hoàn chỉnh đã giải quyết các vùng trước đây không thể tiếp cận.
Clinical relevance
Vì việc gọi và diễn giải biến thể được thể hiện bằng tọa độ tham chiếu, việc lựa chọn và phiên bản của bộ gen tham chiếu ảnh hưởng trực tiếp đến cách các phát hiện bộ gen được báo cáo và so sánh. Mục này mô tả cơ sở hạ tầng tham chiếu như tài liệu giáo dục và không phải là cơ sở cho các quyết định lâm sàng hoặc chẩn đoán cá nhân.
Evidence & guidelines
Tham chiếu được ghi lại thông qua các báo cáo chính của liên minh và đánh giá lắp ráp chứ không phải hướng dẫn lâm sàng: bản nháp ban đầu (2001) và trình tự euchromatin hoàn chỉnh (2004), đánh giá bản dựng GRCh38 (Schneider et al., 2017), và bộ gen người telomere-to-telomere hoàn chỉnh (Nurk et al., 2022) xác định tiêu chuẩn hiện tại và quỹ đạo của nó.
History
Bộ gen tham chiếu của người bắt đầu với trình tự nháp năm 2001 và trình tự euchromatin hoàn chỉnh năm 2004, sau đó được duy trì và cải thiện bởi Liên minh Tham chiếu Bộ gen qua các bản dựng kế tiếp mà đỉnh điểm là GRCh38. Các khoảng trống dai dẳng trong các vùng lặp lại và tâm động cuối cùng đã được đóng lại bởi liên minh telomere-to-telomere, đã tạo ra bộ gen người hoàn chỉnh, không có khoảng trống đầu tiên vào năm 2022 và định hình lại những gì một tiêu chuẩn tham chiếu có thể có.
Key figures
- Deanna Church
- Valerie Schneider
- Adam Phillippy
- Karen Miga
Related topics
Seminal works
- ihgsc-2004
- schneider-2017
- nurk-2022-ref
Frequently asked questions
- Tại sao bộ gen tham chiếu lại có các phiên bản hoặc bản dựng khác nhau?
- Khi quá trình giải trình tự và lắp ráp được cải thiện, tham chiếu được sửa đổi để khắc phục lỗi, lấp đầy khoảng trống và đại diện tốt hơn cho loài; mỗi bản phát hành được gán một phiên bản bản dựng để các tọa độ bộ gen vẫn ổn định và kết quả vẫn có thể so sánh được.
- Chú thích bộ gen là gì?
- Chú thích là quá trình đánh dấu vị trí của các gen, bản phiên mã, yếu tố điều hòa và các đặc điểm khác trên trình tự tham chiếu, biến một chuỗi nucleotide thành một bản đồ có thể diễn giải sinh học.