Was ist der Anwendungsbereich eines QSAR-Modells?

Es ist der Bereich des chemischen Raums, definiert durch die Trainingsdaten, innerhalb dessen die Vorhersagen des Modells als zuverlässig gelten; Vorhersagen für sehr unterschiedliche Moleküle sollten mit Vorsicht behandelt werden.

Wie wird ein QSAR-Modell korrekt validiert?

Über die interne Kreuzvalidierung hinaus sollte es an einem externen Satz von Verbindungen getestet werden, die nicht im Training verwendet wurden, da gute interne Statistiken allein keine Vorhersageleistung garantieren.

QSAR und Eigenschaftsmodellierung

Quantitative Struktur-Aktivitäts- und Struktur-Eigenschafts-Beziehungen erstellen statistische Modelle, die die Aktivität oder Eigenschaft eines Moleküls aus numerischen Deskriptoren seiner Struktur vorhersagen.

Thema finden mit PaperMindDemnächstFind papers & topics

Tools & resources

Folien herunterladen

Learn & explore

VideoDemnächst

Definition

Empirische, datengesteuerte Modelle, die die molekulare Struktur, kodiert als Deskriptoren, mit einer gemessenen Eigenschaft oder biologischen Aktivität für Vorhersagezwecke in Beziehung setzen.

Scope

Umfasst die Konstruktion von QSAR- und QSPR-Modellen, die von ihnen verwendeten Deskriptoren und Lernalgorithmen, die zentrale Bedeutung von Validierung und Anwendungsbereich sowie Anwendungen auf biologische Aktivität und auf physikochemische und ADMET-Eigenschaften. Unterscheidet interpretierbare klassische Modelle von modernen maschinell gelernten Modellen.

Core questions

Wie korreliert die biologische Aktivität oder eine Eigenschaft mit molekularen Deskriptoren?
Wie werden QSAR-Modelle validiert, um eine echte Vorhersagekraft zu gewährleisten?
Was ist der Anwendungsbereich und warum ist er wichtig?
Wie unterscheiden sich klassische QSAR-Modelle von modernen maschinellen Lernmodellen?

Key theories

Hansch-Analyse: Korreliert biologische Aktivität mit physikochemischen Deskriptoren wie Lipophilie sowie elektronischen und sterischen Parametern und begründet damit die quantitative Struktur-Aktivitäts-Beziehung.
Validierung und Anwendungsbereich: Zuverlässige QSAR erfordert eine rigorose externe Validierung und einen definierten Anwendungsbereich, da Modelle schlecht auf Strukturen extrapolieren, die sich von ihren Trainingsdaten unterscheiden.

Clinical relevance

QSAR- und Eigenschaftsmodelle leiten die Leitstrukturoptimierung, priorisieren Verbindungen für Synthese und Testung und sagen Absorption, Verteilung, Metabolismus, Ausscheidung und Toxizität voraus; sie informieren auch die regulatorische Bewertung der chemischen Sicherheit.

History

Gegründet durch die Analyse von Hansch und Fujita aus dem Jahr 1964, die die Aktivität mit physikochemischen Parametern korrelierte, entwickelte sich QSAR durch dreidimensionale und maschinelle Lernvarianten weiter, wobei die OECD später Validierungsprinzipien für die regulatorische Nutzung kodifizierte.

Debates

Validierungsstrenge und Overfitting: Hohe interne Anpassungsstatistiken können eine schlechte tatsächliche Vorhersagekraft maskieren, daher gibt es eine anhaltende Betonung und Debatte über externe Validierung und die korrekte Definition des Anwendungsbereichs.

Key figures

Corwin Hansch
Toshio Fujita
Alexander Tropsha
Johann Gasteiger

Seminal works

hansch1964
tropsha2010

Frequently asked questions

Was ist der Anwendungsbereich eines QSAR-Modells?: Es ist der Bereich des chemischen Raums, definiert durch die Trainingsdaten, innerhalb dessen die Vorhersagen des Modells als zuverlässig gelten; Vorhersagen für sehr unterschiedliche Moleküle sollten mit Vorsicht behandelt werden.
Wie wird ein QSAR-Modell korrekt validiert?: Über die interne Kreuzvalidierung hinaus sollte es an einem externen Satz von Verbindungen getestet werden, die nicht im Training verwendet wurden, da gute interne Statistiken allein keine Vorhersageleistung garantieren.