Representasi dan Deskriptor Molekuler
Komputer memerlukan pengodean molekul yang dapat dibaca mesin; notasi baris, grafik kimia, sidik jari, dan deskriptor numerik menerjemahkan struktur kimia ke dalam bentuk yang dapat disimpan, dicari, dan dimodelkan.
Definition
Pengodean dan fitur terkomputasi yang merepresentasikan struktur molekuler secara digital, mulai dari string kanonis dan grafik hingga vektor bit sidik jari dan deskriptor numerik.
Scope
Mencakup pandangan grafik kimia molekul, notasi baris seperti SMILES dan InChI, kunci struktural dan sidik jari hash, serta keluarga luas deskriptor molekuler yang mengubah struktur menjadi fitur numerik untuk kesamaan dan pemodelan prediktif.
Core questions
- Bagaimana molekul direpresentasikan sebagai grafik dan sebagai string kanonis?
- Apa perbedaan antara kunci struktural, sidik jari hash, dan deskriptor numerik?
- Bagaimana pengidentifikasi unik dan kanonis seperti InChI dihasilkan?
- Bagaimana pilihan representasi membentuk pencarian dan pemodelan selanjutnya?
Key theories
- Grafik kimia dan notasi baris
- Merepresentasikan molekul sebagai grafik berlabel atom dan ikatan, serta menserialisasikannya ke dalam notasi baris ringkas seperti SMILES, memberikan dasar untuk penyimpanan, pertukaran, dan kanonisasi.
- Pengodean deskriptor dan sidik jari
- Mengubah struktur menjadi deskriptor numerik panjang tetap atau sidik jari biner memungkinkan perbandingan kuantitatif, pencarian kesamaan, dan model pembelajaran mesin.
Clinical relevance
Representasi molekuler yang kuat adalah fondasi dari setiap alur kerja kemoinformatika, mulai dari deduplikasi dan pencarian basis data hingga model kuantitatif struktur-aktivitas yang memandu penemuan obat dan material.
History
Dari tabel koneksi awal dan kanonisasi Morgan, bidang ini memperoleh notasi SMILES pada tahun 1988 dan kemudian standar InChI terbuka, di samping proliferasi deskriptor dan sidik jari yang dikatalogkan dalam karya referensi.
Key figures
- David Weininger
- Roberto Todeschini
- Peter Willett
- Stephen Heller
Related topics
Seminal works
- weininger1988
- todeschini2009
Frequently asked questions
- Apa perbedaan antara SMILES dan InChI?
- SMILES adalah notasi baris yang fleksibel dan mudah dibaca manusia yang dapat memiliki beberapa bentuk valid untuk satu molekul, sedangkan InChI adalah pengidentifikasi kanonis terstandardisasi yang dirancang untuk memberikan satu string unik per struktur.
- Apa itu sidik jari molekuler?
- Ini adalah vektor bit yang mengodekan keberadaan fitur atau fragmen struktural, memungkinkan perbandingan kesamaan yang cepat antar molekul menggunakan ukuran berbasis himpunan yang sederhana.