Keragaman Nukleotida dan Klasifikasi Varian
Keragaman nukleotida mengukur seberapa banyak dua sekuens yang dipilih secara acak dari suatu populasi berbeda secara rata-rata, sementara klasifikasi varian mengatur berbagai jenis perbedaan DNA — substitusi nukleotida tunggal, insersi dan delesi kecil, serta perubahan struktural yang lebih besar — menjadi kosakata yang konsisten. Bersama-sama, keduanya menggambarkan seberapa banyak variasi yang dibawa oleh suatu genom dan seperti apa variasi tersebut.
Definition
Keragaman nukleotida (umumnya dilambangkan pi) adalah rata-rata jumlah perbedaan nukleotida per situs antara dua sekuens yang diambil sampelnya dari suatu populasi; klasifikasi varian adalah kategorisasi sistematis dari perbedaan sekuens yang diamati (misalnya, varian nukleotida tunggal, indel, varian struktural).
Scope
Entri ini mencakup ukuran ringkasan standar variasi sekuens dalam populasi, terutama keragaman nukleotida dan jumlah situs bersegregasi, serta klasifikasi jenis varian berdasarkan ukuran dan efek yang diprediksi pada sekuens. Ini memperlakukan konsep-konsep ini sebagai deskriptif dan metodologis; ini tidak menetapkan signifikansi klinis pada varian tertentu.
Core questions
- Bagaimana jumlah variasi sekuens dalam sampel diringkas?
- Bagaimana keragaman nukleotida dan jumlah situs bersegregasi berbeda sebagai estimator?
- Apa saja kelas utama varian genetik berdasarkan ukuran dan jenis?
- Bagaimana varian direpresentasikan dan dipertukarkan dalam format file standar?
Key concepts
- Keragaman nukleotida (pi)
- Situs bersegregasi dan theta Watterson
- Varian nukleotida tunggal (SNV/SNP)
- Insersi-delesi (indel)
- Varian struktural
- Alel referensi dan alternatif
- Format Panggilan Varian (VCF)
Key theories
- Model situs tak terbatas dan theta
- Di bawah asumsi situs tak terbatas, setiap mutasi baru jatuh pada situs yang sebelumnya tidak bermutasi, sehingga parameter mutasi populasi theta dapat diperkirakan baik dari jumlah situs bersegregasi (estimator Watterson) maupun dari perbedaan berpasangan rata-rata (keragaman nukleotida); perbedaan sistematis antara keduanya memberikan informasi tentang penyimpangan dari netralitas.
Mechanisms
Variasi pertama kali dideteksi dengan menyelaraskan bacaan yang diurutkan ke genom referensi dan mengidentifikasi posisi yang berbeda; perbedaan kemudian diklasifikasikan berdasarkan ukuran dan bentuk. Statistik ringkasan memadatkan ini menjadi ukuran tingkat populasi: jumlah situs bersegregasi mendasari estimator theta Watterson, sementara perbedaan berpasangan rata-rata mendefinisikan keragaman nukleotida. Karena keduanya memperkirakan parameter yang sama di bawah model netral berukuran konstan, perbedaannya (diformalisasi oleh Tajima) menandai perubahan demografi atau seleksi. Representasi standar dalam Format Panggilan Varian memungkinkan varian untuk disimpan, dibagikan, dan dibandingkan di seluruh studi.
Clinical relevance
Kosakata varian yang konsisten dan estimasi keragaman yang andal merupakan prasyarat untuk menginterpretasikan data genomik dalam pengaturan kesehatan, karena kategori deskriptif yang sama digunakan ketika genom yang diurutkan disaring untuk varian yang relevan secara klinis. Entri ini menjelaskan bagaimana varian dijelaskan dan dihitung dan bukan merupakan dasar untuk keputusan diagnostik atau pengobatan individu.
Evidence & guidelines
Estimator dasar keragaman sekuens ditetapkan oleh Watterson dan Tajima, sementara survei besar seperti peta SNP manusia awal dan referensi Proyek 1000 Genom memberikan skala empiris variasi manusia. Format Panggilan Varian dan alatnya adalah standar komunitas de facto untuk merepresentasikan varian yang diklasifikasikan.
History
Genetika populasi molekuler awal mengukur variasi melalui survei alozim dan situs restriksi, kemudian melalui pengurutan DNA. Karya Watterson tahun 1975 dan Tajima tahun 1989 memberikan estimator yang masih digunakan hingga saat ini, dan peta SNP manusia tahun 2001 serta konsorsium pengurutan selanjutnya mengubah katalogisasi varian menjadi usaha di seluruh genom, disertai dengan format standar seperti VCF untuk merepresentasikan varian yang dihasilkan.
Key figures
- G. A. Watterson
- Fumio Tajima
- Richard Durbin
- Gonçalo Abecasis
Related topics
Seminal works
- watterson-1975
- tajima-1989
- snp-map-2001
Frequently asked questions
- Apa perbedaan antara keragaman nukleotida dan jumlah situs bersegregasi?
- Jumlah situs bersegregasi menghitung berapa banyak posisi yang bervariasi dalam sampel, sementara keragaman nukleotida merata-ratakan perbedaan antara pasangan sekuens; keduanya memperkirakan parameter dasar yang sama di bawah model netral sederhana, dan perbedaan di antara keduanya itu sendiri informatif.
- Apakah SNP sama dengan mutasi?
- SNP adalah varian nukleotida tunggal yang diamati bersegregasi dalam suatu populasi; ia berasal dari mutasi titik, tetapi istilah tersebut menekankan bahwa varian tersebut hadir pada frekuensi yang cukup besar daripada menjadi perubahan yang baru muncul pada satu individu.