Standar dan Anotasi Genom Referensi
Genom referensi adalah sekuens konsensus representatif yang dikurasi untuk suatu spesies yang berfungsi sebagai sistem koordinat bersama tempat data sekuens baru diselaraskan dan diinterpretasikan. Mempertahankannya sebagai versi yang dibangun, dan melapisi anotasi biologis di atasnya, adalah hal yang membuat hasil genomik dapat dibandingkan di seluruh studi, laboratorium, dan waktu.
Definition
Genom referensi adalah sekuens nukleotida konsensus yang dikurasi yang dipilih untuk merepresentasikan genom suatu spesies, dipertahankan sebagai rakitan versi (build) dan dianotasi dengan lokasi gen dan elemen fungsional lainnya, yang menyediakan kerangka koordinat yang stabil untuk menyelaraskan dan menginterpretasikan data genomik.
Scope
Entri ini mencakup apa itu rakitan referensi, bagaimana ia diberi versi menjadi rakitan berturut-turut (seperti rakitan GRCh38 manusia dan rakitan telomer-ke-telomer), peran anotasi dalam menandai gen dan fitur fungsional, dan pergerakan menuju referensi yang lebih lengkap dan representatif. Ini adalah topik referensi dan infrastruktur, bukan panduan klinis.
Core questions
- Apa itu genom referensi dan mengapa bidang ini membakukan satu genom?
- Bagaimana dan mengapa rakitan referensi diberi versi menjadi rakitan berturut-turut?
- Apa yang ditambahkan anotasi genom pada sekuens referensi?
Key concepts
- Rakitan referensi (sekuens konsensus)
- Pembangunan dan versi genom (misalnya, GRCh38)
- Anotasi genom
- Sistem koordinat untuk penyelarasan
- Rakitan telomer-ke-telomer (tanpa celah)
- Celah rakitan dan penyelesaian
Mechanisms
Genom referensi dirakit dari data sekuens berkualitas tinggi menjadi konsensus yang merepresentasikan spesies daripada individu tunggal mana pun, kemudian dirilis sebagai versi yang dibangun sehingga koordinat genomik tetap stabil dan dapat dikutip. Anotasi melapisi sekuens dengan posisi gen, transkrip, serta elemen regulatori dan repetitif, mengubah koordinat mentah menjadi peta yang dapat diinterpretasikan secara biologis. Rakitan berturut-turut menggabungkan koreksi, mengisi celah, dan meningkatkan representasi; referensi manusia berkembang dari draf tahun 2001 dan sekuens eukromatik selesai tahun 2004 hingga rakitan GRCh38 dan akhirnya ke rakitan telomer-ke-telomer lengkap yang menyelesaikan wilayah yang sebelumnya tidak dapat diakses.
Clinical relevance
Karena penentuan dan interpretasi varian diekspresikan dalam koordinat referensi, pilihan dan versi genom referensi secara langsung memengaruhi bagaimana temuan genomik dilaporkan dan dibandingkan. Entri ini menjelaskan infrastruktur referensi sebagai materi edukasi dan bukan dasar untuk keputusan klinis atau diagnostik individu.
Evidence & guidelines
Referensi didokumentasikan melalui laporan primer konsorsium dan evaluasi rakitan daripada pedoman klinis: draf awal (2001) dan sekuens eukromatik selesai (2004), evaluasi rakitan GRCh38 (Schneider et al., 2017), dan genom manusia telomer-ke-telomer lengkap (Nurk et al., 2022) mendefinisikan standar saat ini dan lintasannya.
History
Genom referensi manusia dimulai dengan draf sekuens tahun 2001 dan sekuens eukromatik selesai tahun 2004, kemudian dipertahankan dan ditingkatkan oleh Konsorsium Referensi Genom di seluruh rakitan berturut-turut yang berpuncak pada GRCh38. Celah yang persisten di wilayah repetitif dan sentromer akhirnya ditutup oleh konsorsium telomer-ke-telomer, yang menghasilkan genom manusia lengkap tanpa celah pertama pada tahun 2022 dan membentuk kembali apa yang bisa menjadi standar referensi.
Key figures
- Deanna Church
- Valerie Schneider
- Adam Phillippy
- Karen Miga
Related topics
Seminal works
- ihgsc-2004
- schneider-2017
- nurk-2022-ref
Frequently asked questions
- Mengapa genom referensi memiliki versi atau rakitan yang berbeda?
- Seiring dengan peningkatan sekuensing dan perakitan, referensi direvisi untuk mengoreksi kesalahan, menutup celah, dan merepresentasikan spesies dengan lebih baik; setiap rilis diberi versi rakitan sehingga koordinat genomik tetap stabil dan hasilnya tetap dapat dibandingkan.
- Apa itu anotasi genom?
- Anotasi adalah proses penandaan lokasi gen, transkrip, elemen regulatori, dan fitur lainnya pada sekuens referensi, mengubah deretan nukleotida menjadi peta yang dapat diinterpretasikan secara biologis.