Quantitative Struktur-Aktivitäts-Analyse (QSAR)
Die quantitative Struktur-Aktivitäts-Beziehungs-Analyse (QSAR) überführt die qualitative Beobachtung, dass die Struktur die Aktivität prägt, in ein mathematisches Modell: Sie setzt numerische Deskriptoren der Molekülstruktur mit einer gemessenen biologischen Aktivität in Beziehung, sodass die Aktivität für noch nicht getestete Verbindungen vorhergesagt werden kann. Sie ist der quantitative Kern der Struktur-Aktivitäts-Argumentation in der medizinischen Chemie.
Definition
Eine quantitative Struktur-Aktivitäts-Beziehung ist ein mathematisches Modell, das numerische Deskriptoren der chemischen Struktur – wie physikochemische, topologische, elektronische oder dreidimensionale Feldeigenschaften – mit einem quantitativen Maß der biologischen Aktivität korreliert, um Struktur-Aktivitäts-Trends zu interpretieren und die Aktivität ungetesteter Verbindungen vorherzusagen.
Scope
Der Eintrag behandelt die Logik der numerischen Beschreibung von Molekülen, die klassische Hansch-Analyse, die auf physikochemischen Parametern basiert, den Übergang zu dreidimensionalen und feld-basierten Methoden, wie Modelle erstellt und validiert werden und wie sie verwendet werden und was ihre Zuverlässigkeit begrenzt. Er behandelt QSAR als Modellierungsmethodik, nicht als klinische Leitlinie.
Core questions
- Wie kann die chemische Struktur numerisch als Deskriptoren dargestellt werden?
- Wie wird eine Beziehung zwischen diesen Deskriptoren und der Aktivität angepasst und interpretiert?
- Was fügen dreidimensionale und feldbasierte QSAR-Methoden über die klassische parameterbasierte Analyse hinaus hinzu?
- Wie wird ein QSAR-Modell validiert, und was definiert seinen Bereich zuverlässiger Vorhersage?
Key concepts
- Molekularer Deskriptor
- Kongenere Reihe
- Hansch-Analyse und Substituentenparameter
- Free-Wilson (additiver Gruppenbeitrags-) Analyse
- 3D-QSAR und molekulare Felder
- Partielle Kleinste-Quadrate-Regression
- Modellvalidierung und Anwendungsbereich
- Overfitting und Zufallskorrelation
Key theories
- Hansch (lineare Freie-Energie) QSAR
- Innerhalb einer kongeneren Reihe kann die biologische Aktivität als lineare Kombination physikochemischer Substituentenparameter ausgedrückt werden – charakteristischerweise ein hydrophober Term zusammen mit elektronischen und sterischen Termen –, basierend auf linearen Freie-Energie-Beziehungen, was ein interpretierbares und prädiktives Aktivitätsmodell ergibt.
- Dreidimensionale feldbasierte QSAR (CoMFA)
- Die vergleichende molekulare Feldanalyse richtet eine Reihe von Molekülen aus und berechnet sterische und elektrostatische Interaktionsfelder an Gitterpunkten um sie herum, um dann diese Feldwerte mittels partieller kleinster Quadrate mit der Aktivität in Beziehung zu setzen, wodurch dreidimensionale Struktur-Aktivitäts-Informationen erfasst und Karten erstellt werden, die zeigen, wo Feldänderungen die Aktivität beeinflussen.
Mechanisms
QSAR kodiert jedes Molekül als eine Reihe von Deskriptoren – physikochemische Parameter wie Lipophilie, elektronische und sterische Terme in der klassischen Hansch-Analyse; Indikatorvariablen für das Vorhandensein von Gruppen in der Free-Wilson-Analyse; oder, in dreidimensionalen Methoden, die Werte sterischer und elektrostatischer Felder, die um ausgerichtete Moleküle abgetastet werden. Eine statistische oder maschinelle Lernmethode passt dann die Beziehung zwischen diesen Deskriptoren und der gemessenen Aktivität für einen Trainingsdatensatz an, wodurch ein Modell entsteht, das interpretiert wird, um zu identifizieren, welche Strukturmerkmale die Aktivität steuern, und das zur Vorhersage der Aktivität für neue Verbindungen verwendet wird. Eine zuverlässige Anwendung hängt von einer sorgfältigen Validierung, einer ehrlichen Schätzung der Vorhersageleistung und der Beachtung des Anwendungsbereichs des Modells ab – der Region des chemischen Raums, die die Trainingsdaten abdecken –, da Modelle sonst Zufallskorrelationen widerspiegeln oder außerhalb der Daten, auf denen sie aufgebaut wurden, versagen können.
Clinical relevance
QSAR untermauert, wie Kandidatenmoleküle priorisiert und optimiert werden und wie einige Eigenschaften- und Toxizitätsvorhersagen in der Arzneimittelentwicklung und der chemischen Sicherheitsbewertung generiert werden. Der Inhalt ist ein bildungspolitischer Hintergrund zu einer Modellierungsmethodik; er beschreibt, wie Aktivität aus der Struktur vorhergesagt wird und ist keine Anleitung für die klinische Anwendung einer Verbindung.
Evidence & guidelines
Die QSAR-Methodik ist in den grundlegenden Arbeiten dokumentiert, die parameterbasierte und feldbasierte Analysen einführten, sowie in umfassenden Übersichten, die die Entwicklung des Feldes, Validierungspraktiken und Best-Practice-Erwartungen untersuchen. Dies sind methodische Design- und Modellierungsprinzipien und keine klinischen Praxisleitlinien; formale Leitlinien zur Validierung existieren in der regulatorischen und cheminformatischen Literatur, werden hier jedoch nur auf Prinzipienebene zusammengefasst.
History
Die quantitative SAR begann 1964, als Hansch und Fujita die biologische Aktivität mit physikochemischen Substituentenparametern durch lineare Freie-Energie-Beziehungen korrelierten, während der Free-Wilson-Ansatz ein paralleles additives Gruppenbeitragsmodell bot. Die Zusammenstellung von Partitionsdaten durch Leo und Hansch lieferte Deskriptoren für diese Arbeit. 1988 führten Cramer und Kollegen die vergleichende molekulare Feldanalyse ein, die QSAR in drei Dimensionen erweiterte. Das Feld expandierte anschließend mit vielen Deskriptortypen und maschinellen Lernmethoden, und Übersichten wie die von Cherkasov und Kollegen aus dem Jahr 2014 zogen Bilanz über seine Entwicklung, Validierungsstandards und zukünftige Richtungen.
Debates
- Prädiktivität, Validierung und der Anwendungsbereich
- Wie streng QSAR-Modelle validiert werden müssen, um vertrauenswürdig zu sein – einschließlich der Gefahren von Overfitting, Zufallskorrelation und Extrapolation über den Trainingsdatensatz hinaus – war ein anhaltendes Anliegen, wobei sich das Feld auf Anforderungen für externe Validierung und explizite Anwendungsbereiche geeinigt hat.
Key figures
- Corwin Hansch
- Toshio Fujita
- Spencer Free
- James Wilson
- Richard Cramer
- Alexander Tropsha
Related topics
Seminal works
- hansch-fujita-1964
- cramer-1988
- cherkasov-2014
Frequently asked questions
- Was ist QSAR?
- QSAR, oder quantitative Struktur-Aktivitäts-Beziehung, ist ein mathematisches Modell, das numerische Deskriptoren der Struktur eines Moleküls mit einer gemessenen biologischen Aktivität in Beziehung setzt, wodurch die Aktivität ungetesteter Verbindungen vorhergesagt und die strukturellen Treiber der Aktivität identifiziert werden können.
- Was ist der Unterschied zwischen klassischer QSAR und 3D-QSAR?
- Klassische QSAR (wie die Hansch-Analyse) setzt die Aktivität mit physikochemischen oder anderen tabellierten Deskriptoren von Substituenten oder ganzen Molekülen in Beziehung; 3D-QSAR-Methoden wie CoMFA richten Moleküle in drei Dimensionen aus und verwenden die Werte sterischer und elektrostatischer Felder um sie herum, wodurch räumliche Struktur-Aktivitäts-Informationen erfasst und Karten erstellt werden, die zeigen, wo Änderungen die Aktivität beeinflussen.