QSAR ve Özellik Modellemesi
Kantitatif yapı-aktivite ve yapı-özellik ilişkileri, bir molekülün aktivitesini veya özelliğini yapısının sayısal tanımlayıcılarından yola çıkarak tahmin eden istatistiksel modeller oluşturmaktadır.
Tanım
Moleküler yapıyı, tanımlayıcılar olarak kodlanmış şekilde, ölçülen bir özellik veya biyolojik aktivite ile tahmin amaçlı olarak ilişkilendiren ampirik, veriye dayalı modellerdir.
Kapsam
QSAR ve QSPR modellerinin oluşturulmasını, kullandıkları tanımlayıcıları ve öğrenme algoritmalarını, geçerliliğin (validation) ve uygulanabilirlik alanının (applicability domain) merkezi önemini, biyolojik aktiviteye, fizikoşimik ve ADMET özelliklerine uygulamalarını kapsamaktadır. Yorumlanabilir klasik modelleri, modern makine öğrenimi tabanlı modellerden ayırmaktadır.
Temel sorular
- Biyolojik aktivite veya bir özellik, moleküler tanımlayıcılarla nasıl ilişkilendirilmektedir?
- Gerçek tahmin edilebilirliği sağlamak için QSAR modelleri nasıl doğrulanmaktadır?
- Uygulanabilirlik alanı nedir ve neden önemlidir?
- Klasik QSAR ve modern makine öğrenimi modelleri nasıl farklılık göstermektedir?
Temel kuramlar
- Hansch analysis
- Biyolojik aktiviteyi lipofiliklik, elektronik ve sterik parametreler gibi fizikoşimik tanımlayıcılarla ilişkilendirmekte, kantitatif yapı-aktivite ilişkisinin temelini oluşturmaktadır.
- Validation and applicability domain
- Güvenilir QSAR, titiz harici geçerlilik (external validation) ve tanımlanmış bir uygulanabilirlik alanı gerektirmektedir, çünkü modeller, eğitim verilerinden farklı yapılara kötü bir şekilde ekstrapolasyon yapmaktadır.
Klinik önem
QSAR ve özellik modelleri, öncü optimizasyonuna rehberlik etmekte, sentez ve test için bileşikleri önceliklendirmekte, absorpsiyon, dağılım, metabolizma, atılım ve toksisiteyi tahmin etmekte ve kimyasal güvenliğin düzenleyici değerlendirmesine bilgi sağlamaktadır.
Tarihçe
Hansch ve Fujita'nın 1964'teki aktiviteyi fizikoşimik parametrelerle ilişkilendiren analiziyle temelleri atılan QSAR, üç boyutlu ve makine öğrenimi varyantlarıyla gelişmiş, OECD'nin daha sonra düzenleyici kullanım için geçerlilik (validation) ilkelerini kodlamasıyla ilerlemiştir.
Tartışmalar
- Geçerlilik titizliği ve aşırı uyum (overfitting)
- Yüksek iç uyum istatistikleri, zayıf gerçek tahmin edilebilirliği maskeleyebilmektedir; bu nedenle harici geçerlilik (external validation) ve uygun uygulanabilirlik alanı tanımı üzerinde sürekli bir vurgu ve tartışma bulunmaktadır.
Öne çıkan isimler
- Corwin Hansch
- Toshio Fujita
- Alexander Tropsha
- Johann Gasteiger
İlgili konular
Temel eserler
- hansch1964
- tropsha2010
Sıkça sorulan sorular
- Bir QSAR modelinin uygulanabilirlik alanı nedir?
- Eğitim verileriyle tanımlanan, modelin tahminlerinin güvenilir kabul edildiği kimyasal uzay bölgesidir; çok farklı moleküller için yapılan tahminlere dikkatle yaklaşılmalıdır.
- Bir QSAR modeli nasıl doğru bir şekilde doğrulanmaktadır?
- İç çapraz doğrulamanın ötesinde, eğitimde kullanılmayan harici bir bileşik seti üzerinde test edilmelidir, çünkü tek başına iyi iç istatistikler tahmin performansını garanti etmemektedir.