Moleküler Gösterim ve Tanımlayıcılar
Bilgisayarların moleküllerin makine tarafından okunabilir kodlamalarına ihtiyacı vardır; çizgi gösterimleri, kimyasal grafikler, parmak izleri ve sayısal tanımlayıcılar, kimyasal yapıyı depolanabilir, aranabilir ve modellenebilir biçimlere dönüştürmektedir.
Tanım
Moleküler yapıyı dijital olarak temsil eden kodlamalar ve hesaplanmış özellikler olup, kanonik dizgilerden ve grafiklerden parmak izi bit-vektörlerine ve sayısal tanımlayıcılara kadar uzanmaktadır.
Kapsam
Moleküllerin kimyasal-grafik görünümünü, SMILES ve InChI gibi çizgi gösterimlerini, yapısal anahtarları ve hashlenmiş parmak izlerini ve yapıyı benzerlik ve tahmine dayalı modelleme için sayısal özelliklere dönüştüren geniş moleküler tanımlayıcı ailesini kapsamaktadır.
Temel sorular
- Moleküller grafikler ve kanonik dizgiler olarak nasıl temsil edilmektedir?
- Yapısal anahtarlar, hashlenmiş parmak izleri ve sayısal tanımlayıcılar arasındaki fark nedir?
- InChI gibi benzersiz, kanonik bir tanımlayıcı nasıl oluşturulmaktadır?
- Gösterim seçimi, sonraki arama ve modellemeyi nasıl şekillendirmektedir?
Temel kuramlar
- Kimyasal grafik ve çizgi gösterimi
- Bir molekülü atomların ve bağların etiketli bir grafiği olarak temsil etmek ve onu SMILES gibi kompakt bir çizgi gösterimine dönüştürmek, depolama, değişim ve kanonikleştirmek için temel sağlamaktadır.
- Tanımlayıcı ve parmak izi kodlaması
- Yapıyı sabit uzunluklu sayısal tanımlayıcılara veya ikili parmak izlerine dönüştürmek, kantitatif karşılaştırmayı, benzerlik aramasını ve makine öğrenimi modellerini mümkün kılmaktadır.
Klinik önem
Sağlam moleküler gösterimler, veritabanı tekilleştirmesi ve aramadan, ilaç ve malzeme keşfine rehberlik eden kantitatif yapı-aktivite modellerine kadar her kemoinformatik iş akışının temelini oluşturmaktadır.
Tarihçe
Erken bağlantı tablolarından ve Morgan kanonikleştirmesinden itibaren, alan 1988'de SMILES gösterimini ve daha sonra açık InChI standardını kazanmış, bununla birlikte referans eserlerde kataloglanmış tanımlayıcıların ve parmak izlerinin çoğalması gözlenmiştir.
Öne çıkan isimler
- David Weininger
- Roberto Todeschini
- Peter Willett
- Stephen Heller
İlgili konular
Temel eserler
- weininger1988
- todeschini2009
Sıkça sorulan sorular
- SMILES ve InChI arasındaki fark nedir?
- SMILES, bir molekül için birden fazla geçerli forma sahip olabilen esnek, insan tarafından okunabilir bir çizgi gösterimi iken, InChI, her yapı için tek bir benzersiz dizgi sağlamak üzere tasarlanmış standartlaştırılmış, kanonik bir tanımlayıcıdır.
- Moleküler parmak izi nedir?
- Yapısal özelliklerin veya fragmanların varlığını kodlayan bir bit-vektörüdür ve basit küme tabanlı ölçümler kullanarak moleküller arasında hızlı benzerlik karşılaştırmalarına olanak tanımaktadır.