QSAR und Eigenschaftsmodellierung
Quantitative Struktur-Aktivitäts- und Struktur-Eigenschafts-Beziehungen erstellen statistische Modelle, die die Aktivität oder Eigenschaft eines Moleküls aus numerischen Deskriptoren seiner Struktur vorhersagen.
Definition
Empirische, datengesteuerte Modelle, die die molekulare Struktur, kodiert als Deskriptoren, mit einer gemessenen Eigenschaft oder biologischen Aktivität für Vorhersagezwecke in Beziehung setzen.
Scope
Umfasst die Konstruktion von QSAR- und QSPR-Modellen, die von ihnen verwendeten Deskriptoren und Lernalgorithmen, die zentrale Bedeutung von Validierung und Anwendungsbereich sowie Anwendungen auf biologische Aktivität und auf physikochemische und ADMET-Eigenschaften. Unterscheidet interpretierbare klassische Modelle von modernen maschinell gelernten Modellen.
Core questions
- Wie korreliert die biologische Aktivität oder eine Eigenschaft mit molekularen Deskriptoren?
- Wie werden QSAR-Modelle validiert, um eine echte Vorhersagekraft zu gewährleisten?
- Was ist der Anwendungsbereich und warum ist er wichtig?
- Wie unterscheiden sich klassische QSAR-Modelle von modernen maschinellen Lernmodellen?
Key theories
- Hansch-Analyse
- Korreliert biologische Aktivität mit physikochemischen Deskriptoren wie Lipophilie sowie elektronischen und sterischen Parametern und begründet damit die quantitative Struktur-Aktivitäts-Beziehung.
- Validierung und Anwendungsbereich
- Zuverlässige QSAR erfordert eine rigorose externe Validierung und einen definierten Anwendungsbereich, da Modelle schlecht auf Strukturen extrapolieren, die sich von ihren Trainingsdaten unterscheiden.
Clinical relevance
QSAR- und Eigenschaftsmodelle leiten die Leitstrukturoptimierung, priorisieren Verbindungen für Synthese und Testung und sagen Absorption, Verteilung, Metabolismus, Ausscheidung und Toxizität voraus; sie informieren auch die regulatorische Bewertung der chemischen Sicherheit.
History
Gegründet durch die Analyse von Hansch und Fujita aus dem Jahr 1964, die die Aktivität mit physikochemischen Parametern korrelierte, entwickelte sich QSAR durch dreidimensionale und maschinelle Lernvarianten weiter, wobei die OECD später Validierungsprinzipien für die regulatorische Nutzung kodifizierte.
Debates
- Validierungsstrenge und Overfitting
- Hohe interne Anpassungsstatistiken können eine schlechte tatsächliche Vorhersagekraft maskieren, daher gibt es eine anhaltende Betonung und Debatte über externe Validierung und die korrekte Definition des Anwendungsbereichs.
Key figures
- Corwin Hansch
- Toshio Fujita
- Alexander Tropsha
- Johann Gasteiger
Related topics
Seminal works
- hansch1964
- tropsha2010
Frequently asked questions
- Was ist der Anwendungsbereich eines QSAR-Modells?
- Es ist der Bereich des chemischen Raums, definiert durch die Trainingsdaten, innerhalb dessen die Vorhersagen des Modells als zuverlässig gelten; Vorhersagen für sehr unterschiedliche Moleküle sollten mit Vorsicht behandelt werden.
- Wie wird ein QSAR-Modell korrekt validiert?
- Über die interne Kreuzvalidierung hinaus sollte es an einem externen Satz von Verbindungen getestet werden, die nicht im Training verwendet wurden, da gute interne Statistiken allein keine Vorhersageleistung garantieren.