क्यूएसएआर (QSAR) और गुण मॉडलिंग
मात्रात्मक संरचना-गतिविधि और संरचना-गुण संबंध ऐसे सांख्यिकीय मॉडल बनाते हैं जो किसी अणु की गतिविधि या गुण का अनुमान उसकी संरचना के संख्यात्मक विवरणकों से लगाते हैं।
Definition
अनुभवजन्य, डेटा-संचालित मॉडल जो आणविक संरचना को, विवरणकों के रूप में एन्कोड किया गया, पूर्वानुमानित उद्देश्यों के लिए एक मापे गए गुण या जैविक गतिविधि से संबंधित करते हैं।
Scope
क्यूएसएआर (QSAR) और क्यूएसपीआर (QSPR) मॉडल के निर्माण, उनके द्वारा उपयोग किए जाने वाले विवरणकों और सीखने के एल्गोरिदम, सत्यापन और प्रयोज्यता डोमेन के केंद्रीय महत्व, और जैविक गतिविधि तथा भौतिक-रासायनिक और एडीमेट (ADMET) गुणों के अनुप्रयोगों को शामिल करता है। यह व्याख्या योग्य शास्त्रीय मॉडलों को आधुनिक मशीन-लर्न किए गए मॉडलों से अलग करता है।
Core questions
- जैविक गतिविधि या कोई गुण आणविक विवरणकों से कैसे सहसंबंधित होता है?
- वास्तविक पूर्वानुमान सुनिश्चित करने के लिए क्यूएसएआर (QSAR) मॉडल को कैसे मान्य किया जाता है?
- प्रयोज्यता डोमेन क्या है और यह क्यों महत्वपूर्ण है?
- शास्त्रीय क्यूएसएआर (QSAR) और आधुनिक मशीन-लर्निंग मॉडल में क्या अंतर है?
Key theories
- हैन्श विश्लेषण (Hansch analysis)
- जैविक गतिविधि को भौतिक-रासायनिक विवरणकों जैसे कि लिपोफिलिसिटी (lipophilicity) और इलेक्ट्रॉनिक व स्टेरिक (steric) मापदंडों से सहसंबंधित करता है, जिससे मात्रात्मक संरचना-गतिविधि संबंध की नींव पड़ी।
- सत्यापन और प्रयोज्यता डोमेन
- विश्वसनीय क्यूएसएआर (QSAR) के लिए कठोर बाहरी सत्यापन और एक परिभाषित प्रयोज्यता डोमेन की आवश्यकता होती है, क्योंकि मॉडल अपने प्रशिक्षण डेटा से भिन्न संरचनाओं के लिए खराब रूप से बहिर्वेशित होते हैं।
Clinical relevance
क्यूएसएआर (QSAR) और गुण मॉडल लीड ऑप्टिमाइजेशन का मार्गदर्शन करते हैं, संश्लेषण और परीक्षण के लिए यौगिकों को प्राथमिकता देते हैं, और अवशोषण, वितरण, चयापचय, उत्सर्जन और विषाक्तता का अनुमान लगाते हैं, और वे रासायनिक सुरक्षा के नियामक मूल्यांकन को सूचित करते हैं।
History
हैन्श (Hansch) और फुजिता (Fujita) के 1964 के विश्लेषण द्वारा स्थापित, जिसमें गतिविधि को भौतिक-रासायनिक मापदंडों से सहसंबंधित किया गया था, क्यूएसएआर (QSAR) त्रि-आयामी और मशीन-लर्निंग वेरिएंट के माध्यम से विकसित हुआ, जिसमें ओईसीडी (OECD) ने बाद में नियामक उपयोग के लिए सत्यापन सिद्धांतों को संहिताबद्ध किया।
Debates
- सत्यापन की कठोरता और ओवरफिटिंग (overfitting)
- उच्च आंतरिक फिट सांख्यिकी खराब वास्तविक पूर्वानुमान को छिपा सकती है, इसलिए बाहरी सत्यापन और उचित प्रयोज्यता-डोमेन परिभाषा पर निरंतर जोर और बहस होती है।
Key figures
- Corwin Hansch
- Toshio Fujita
- Alexander Tropsha
- Johann Gasteiger
Related topics
Seminal works
- hansch1964
- tropsha2010
Frequently asked questions
- क्यूएसएआर (QSAR) मॉडल का प्रयोज्यता डोमेन क्या है?
- यह रासायनिक स्थान का वह क्षेत्र है, जिसे प्रशिक्षण डेटा द्वारा परिभाषित किया गया है, जिसके भीतर मॉडल के पूर्वानुमानों को विश्वसनीय माना जाता है; बहुत भिन्न अणुओं के लिए पूर्वानुमानों को सावधानी से देखा जाना चाहिए।
- क्यूएसएआर (QSAR) मॉडल को ठीक से कैसे मान्य किया जाता है?
- आंतरिक क्रॉस-वैलिडेशन (cross-validation) के अलावा, इसे यौगिकों के एक बाहरी सेट पर परीक्षण किया जाना चाहिए जिसका उपयोग प्रशिक्षण में नहीं किया गया था, क्योंकि अकेले अच्छे आंतरिक सांख्यिकी पूर्वानुमान प्रदर्शन की गारंटी नहीं देते हैं।